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本 书 对 图 像 工 程 ( 图 像 处 理 、 图 像 分 析 、 图 像 理解 及 其 技术 应 用 ?学习 中 的 各 类 问题 
进行 了 分 析 和 解答 。 它 提供 了 一 些 帮 助 进行 相关 课程 教学 和 学 习 的 参考 和 补充 材料 , 教 
师 可 以 将 之 作为 教 参 或 教 辅 使 用 ,学 习 者 可 以 将 之 作为 学 习 辅 导 书 或 深入 钻研 的 参 
考 书 。 

笔者 在 过 去 20 多 年 先后 开设 并 讲授 过 10 多 门 本 科 生 和 研究 生 的 “图 像 工程 ?课程 ,其 
中 一 些 讲 了 10 多 年 ,长 的 讲 了 20 多 年 。 笔 者 近 20 年 还 编写 出 版 了 30 多 本 有 关 图 像 工程 
的 教材 ,至 今 已 发 行 了 30 多 万 册 。 在 授课 和 答疑 等 各 个 与 学 习 者 交流 的 环节 和 过 程 中 , 笔 
者 陆续 遇 到 和 收集 了 来 自 多 方面 的 问题 。 从 内 容 上 说 ,它们 有 些 涉 及 比较 容易 混淆 的 概念 、 
有 些 是 教材 中 限于 篇 幅 和 学 时 未 能 细 化 的 步骤 有 些 是 需要 示例 才能 描述 清楚 的 原理 .有些 
是 需要 图 表 帮 助 以 直观 化 的 方法 。 解 析 这 些 问题 可 以 帮助 教学 .深化 理解 ,有 助 于 学 习 和 复 
习 , 也 可 用 于 测验 和 考试 。 

这 些 问题 从 来 源 上 说 ,有 些 源 自 历年 课程 的 考试 题 ,也 有 些 源 自 布置 的 大 作业 上 题 /项 
目 训练 题 ; 既 有 一 些 改编 自 笔者 在 授课 时 学 生 的 提问 ,也 有 一 些 改编 自 教材 使 用 者 通过 
电话 或 邮件 与 笔者 交流 的 问题 ,还 有 一 些 改编 自前 几 版 教材 中 的 讲解 例题 或 精 选 的 练 
习题 。 

本 书 从 教 和 学 的 角度 出 发 , 共 选 取 了 256 个 问题 单元 ,每 个 问题 单元 均 由 3 部 分 组 成 。 

(1) 标 题 : 简明 扼要 地 点 出 问题 的 中 心 内 容 ; 

(2) 题 面 : 具体 描绘 了 问题 的 条 件 、 要 求 ; 

(3) 解 析 : 对 问题 进行 了 详细 的 分 析 和 解答 。 

上 述 对 问题 单元 的 构建 ,将 常见 的 例题 形式 与 习题 形式 进行 了 结合 。 每 个 问题 单元 都 
可 看 作 加 了 标题 (指示 要 考查 的 主题 ) 的 习题 或 加 了 题 面 (可 与 解析 结果 结合 ) 的 例题 。 所 
以 ,一 方面 教师 可 用 作 讲 解 例题 以 深化 教学 或 示例 技术 效果 ,或 (修改 调整 后 ) 用 作 考试 、 测 
验 题 ; 另 一 方面 学 习 者 可 用 来 复习 总 结对 概念 的 学 习 或 参考 开拓 解决 问题 的 思路 ,或 对 学 
习 效 果 进 行 自我 测试 。 

全 书 由 5 个 单元 组 成 ,图 像 工 程 的 3 个 层次 一 一 图 像 处 理 、 图 像 分 析 、 图 像 理 解 一 一 各 
为 一 个 单元 ,它们 共同 的 基础 知识 为 一 个 单元 ,与 它们 相关 的 参考 内 容 为 男 一 个 单元 。 参 考 
文献 和 相关 教材 是 按 单元 给 出 的 。 每 个 单元 又 分 成 3 章 或 4 章 , 每 章 基本 对 应 一 大 类 图 像 
技术 。 对 属于 图 像 处 理 、 图 像 分 析 、 图 像 理 解 3 类 之 一 的 课程 ,可 以 选择 相应 单元 的 对 应 章 
再 加 上 一 部 分 基础 知识 的 对 应 章 和 一 部 分 相关 参考 的 对 应 章 。 

全 书 共 18 章 (二 级 标题 ), 各 章 均 包含 10 个 或 以 上 的 问题 单元 (以 三 级 标题 标注 )。 全 
书 共 有 文字 (也 包括 图 片 绘图、 表格、 公式 等 )30 多 万 。 本 书 共有 编号 的 图 211 个 (包括 244 





幅 图 片 )、 表 格 50 个 。 书 末 还 给 出 了 300 多 个 主题 索引 (及 英 译 ) ,这 些 主 题词 可 按 问题 编号 
索引 。 另 外 , 书 中 的 彩色 图 片 印刷 后 均 为 黑白 的 ,但 可 以 通过 手机 扫描 图 片 旁 的 二 维 码 , 查 
看 对 应 彩色 照片 ,获得 更 多 的 信息 和 更 好 的 观察 效果 。 

本 书 的 选材 内 容 和 结构 方式 都 是 新 的 尝试 ,欢迎 使 用 者 提出 宝贵 意见 和 建议 。 

最 后 ,要 特别 感谢 我 的 妻子 何 共 和 女 儿童 荷 铭 , 正 是 她 们 的 理解 和 支持 ,使 本 书 得 以 在 
节日 中 完稿 。 

章 毓 晋 
2018 年 五 一 节 于 书房 
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本 单元 包括 4 章 : 

第 1 章 图 像 采集 
第 2 章 像素 联系 
第 3 章 形态 变换 
第 4 章 图 像 变换 


覆盖 范围 /内 容 简介 

人 们 一 般 将 图 像 看 作对 场景 或 景物 的 一 种 可 视 表现 形式 。 严 格 地 说 ,图 像 是 用 各 种 观测 系统 
以 不 同形 式 和 手段 观测 客观 世界 而 获得 的 ,可 以 直接 或 间接 作用 于 人 眼 并 进而 产生 视 知觉 的 实体 。 
人 的 视觉 系统 就 是 一 个 观测 系统 ,通过 它 得 到 的 图 像 就 是 客观 景物 在 人 心目 中 形成 的 影像 。 

图 像 含 有 丰富 的 信息 。 科 学 研究 和 统计 表明 ,人 类 从 外 界 获得 的 信息 约 有 75% 来 自视 
觉 系统 ,也 就 是 从 图 像 中 获得 的 。 这 里 图 像 的 概念 是 比较 广义 的 ,包括 照片 绘图、 动画 、 视 
像 , 甚 至 文档 等 。 人 们 常 说 “ 百 闻 不 如 一 见 ”“ 一 图 值 千 字 ”。 这些 都 说 明 图 像 中 所 含 的 信息 
内 容 非常 丰富 ,是 最 主要 的 信息 源 。 

对 图 像 的 采集 和 加 工 技术 近年 来 得 到 了 极 大 的 重视 和 长 足 的 进展 ,出 现 了 许多 有 关 的 
新 理论 .新 方法 、 新 算法 、 新 手段 和 新 设备 。 图 像 已 在 科学 研究 、 工 业 生 产 、 医 疗 卫生 、 教 育 、 
娱乐 ,管理 和 通信 等 方面 得 到 了 广泛 的 应 用 。 这 些 技术 都 可 以 集合 在 图 像 工程 的 框架 下 。 

图 像 工程 是 一 门 系 统 地 研究 各 种 图 像 理 论 、 技 术 和 应 用 的 新 的 交叉 学 科 。 它 的 研究 方 
法 与 数学 ,物理 学 、 生 理学 、 心 理学、 电子 学 、 计 算 机 科学 等 学 科 相 互 借鉴 , 它 的 研究 范围 与 模 
式 识别 、 计 算 机 视觉 计算 机 图 形 学 等 专业 互相 交叉, 它 的 研究 进展 与 人 工 智能 、 神 经 网 络 、 
遗传 算法 模糊 逻辑 等 理论 和 技术 密切 相关 , 它 的 发 展 应 用 与 生物 医学 、 远 感 、 通 信 、 文 档 处 





理 等 许多 领域 紧密 结合 。 

图 像 工程 的 研究 内 容 非常 丰富 ,覆盖 面 也 很 广 , 可 以 分 为 3 个 层次 : 图 像 处 理 、 图 像 分 
析 和 图 像 理 解 。 从 学 习 图 像 工程 的 角度 来 说 ,有 关 线 性 代数 和 矩阵 数学 知识 .计算 机 软 硬 件 
知识 .电子 器 件 和 电路 知识 以 及 信号 处 理 等 都 是 很 有 用 的 基础 。 

如 果 将 图 像 处 理 、 图 像 分 析 和 图 像 理解 看 作 图 像 工 程 的 主干 ,那么 使 用 各 种 成 像 设备 进 
行 图 像 的 采集 (对 场景 信号 的 采样 和 量化 ) ,建立 像素 (图 像 单元 ) 之 间 的 各 种 联系 ,运用 各 种 
形态 变换 (图 像 域内 的 空间 变换 ) 和 图 像 变换 (在 图 像 域 与 其 他 变换 域 之 间 的 变换 ) 是 实现 图 
像 处 理 、 图 像 分 析 和 图 像 理 解 的 基础 。 

参考 书目 /配合 教材 

与 本 单元 内 容 相 关 的 一 些 参考 书目 ,以 及 本 单元 内 容 可 与 之 配合 学 习 的 典型 教材 包括 ， 
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图 像 采 集 是 所 有 图 像 技术 的 基础 ,因为 所 有 对 图 像 的 加 工 技术 都 要 依赖 或 针对 采集 到 
的 图 像 来 进行 。 图 像 采集 和 加 工 的 过 程 与 人 的 视觉 过 程 有 相当 的 相似 性 。 人 的 视觉 过 程 由 
光学 过 程 、 化 学 过 程 和 神经 处 理 过 程 这 3 个 顺序 的 过 程 构成 。 其 中 ,光学 过 程 决定 了 场景 与 
成 像 的 空间 关系 ,而 化 学 过 程 决定 了 场景 中 的 辐射 与 成 像 之 间 的 亮度 关系 。 

图 像 采 集 涉及 的 内 容 很 多 。 为 用 电子 器 件 实现 类 似 的 光学 过 程 和 化 学 过 程 , 既 要 考虑 
图 像 采 集 装 置 方面 的 问题 ,如 采集 器 件 的 灵敏 度 、. 信 噪 比 等 性 能 指标 ,包括 光源 和 亮度 成 像 
模型 ; 还 要 考虑 摄像 机 成 像 模型 (投影 模式 .标定 程 序 等 )。 如 果 要 对 深度 信息 进行 采集 ,可 
使 用 直接 采集 深度 图 像 的 装置 和 方法 (包括 结构 光 方 法 、 深 度 图 和 灰 度 图 同时 采集 的 方法 
等 ) ,或 使 用 立体 视觉 的 方式 (如 双 目 横向 模式 、, 双 目 横向 会 聚 模式 和 双 目 轴 向 模式 等 ) ,或 使 
用 显微镜 和 共聚 焦 显 微 镜 等 进行 3-D 分 层 成 像 。 为 用 计算 机 实现 神经 处 理 过 程 , 需 要 进行 
采样 (近年 借助 压缩 感知 理论 ,对 稀 疏 信号 实现 了 采样 数量 的 大 幅 减 少 ) 与 量化 ,这 与 数字 化 
过 程 和 模型 都 有 紧密 联系 。 所 采集 到 图 像 的 质量 与 其 空间 分 辨 率 和 幅度 分 辩 率 都 有 关 , 还 
与 图 像 的 亮度 ,对 比 度 、 色 彩 、 纹 理 、 形 状 、 轮 廓 等 有 关 。 

本 章 的 问题 涉及 上 述 图 像 采集 多 个 方面 的 概念 。 


1-1 变焦 操作 与 采样 操作 


各 题 面 : 

变焦 操作 与 采样 操作 有 什么 联系 ? 讨论 两 种 操作 的 区 别 。 

要 解 析 ， 

两 种 操作 的 联系 : 拉 近 变焦 的 操作 可 看 作 一 种 过 采样 操作 (采样 密集 了 ) ,而 拉 远 变焦 
的 操作 可 看 作 一 种 欠 采 样 操作 (采样 稀疏 了 ) 。 

两 种 操作 的 区 别 : 采样 操作 一 般 是 在 不 改变 图 像 尺 寸 和 视野 范围 的 情况 下 来 确定 图 像 
的 分 辩 率 ,根据 在 恰当 的 采样 率 下 得 到 的 图 像 可 以 完全 从 采样 信号 中 恢复 原来 的 信号 。 变 
焦 操 作 一 般 会 改变 图 像 的 尺寸 或 视野 范围 。 在 给 定 光 学 元 件 的 条 件 下 ,能 达到 的 最 佳 分 辩 
率 是 一 定 的 ,所 以 采样 操作 总 是 有 一 个 采样 率 的 限度 ; 但 是 通过 拉 近 变焦 操作 ,可 以 在 相同 
的 尺寸 内 采集 一 个 更 小 范围 内 的 细节 ,这 相当 于 提高 了 对 于 整个 目标 的 某 一 个 范围 的 采样 
率 。 当 然 , 这 种 提高 是 以 牺牲 视野 范围 为 代价 的 。 拉 远 变 焦 与 此 正 相 反 , 扩 大 了 视野 范围 但 
同时 相当 于 降低 了 采样 率 。 





1-2 图 像 与 场景 的 几何 信息 


各 题 面 : 

试 举例 说 明 一 幅 图 像 本 身 并 不 具备 恢复 客观 场景 
的 所 有 几何 信息 。 

所 解析 : 

因为 现实 中 的 场景 都 是 3-D 的 ,而 图 像 的 成 像 
是 3-D 景 物 向 2-D 的 投影 ,丢失 了 深度 信息 ,所 以 普通 
的 2-D 图 像 本 身 并 不 具备 恢复 客观 场景 中 所 有 结构 的 
几何 信息 。 另 外 ,景物 没有 被 成 像 装置 观察 到 的 部 分 
信息 也 无 法 获取 。 再 如 图 解 1-2 中 ,人 与 月 亮 琶 加 在 一 图 解 1-2 ”以 月 亮 为 背景 的 一 幅 图 像 
幅 图 像 中 ,从 这 幅 图 像 无 法 恢复 出 客观 场景 中 不 同 景 
物 的 实际 几何 尺寸 。 





1-3 成像 单元 数 


气 题 面 ， 
一 般 认 为 人 眼 的 角 分 辨 率 约 为 1 , 即 人 可 检测 到 lm 外 、 宽 度 约 为 17. 5mm 的 线条 。 这 
相当 于 在 边 长 上 = 二 9mm 的 CCD 摄像 机 的 成 像 单元 阵列 中 排列 多 少 个 单元 ? 
气 解析 ， 
参见 图 解 1-3 , 取 摄 像 机 的 焦距 等 于 人 了 眼 焦距 , 即 为 17mm', 则 线条 的 成 像 宽度 W 可 写成 
W=17X17.5X10 盖 0.3(mm) 


1000mm 17mm 
一- 


| 
mnt 一 - 一 - = = = -一 一 

















图 解 1-3 ”摄像 机 模型 


可 见 ,摄像 机 成 像 单 元 的 间距 D=0. 3mm。 摄 像 机 在 水 平 或 垂直 方向 上 的 单元 数 为 
| 
WD “Qi3 


即 相 当 于 在 边 长 L 二 9mm 的 CCD 摄像 机 的 成 像 单元 阵列 中 排列 了 30X30 个 单元 。 


1-4 景深 的 计算 








各 题 面 : 
设 一 个 镜头 的 孔径 为 10, 可 以 容忍 的 模糊 圆 盘 的 直径 为 1”。 


* 本 书 一 些 题目 中 的 数据 重 在 表示 各 数据 量 之 间 的 关系 , 故 未 给 出 数据 单位 。 
本 通 各 


(1) 如 果 景 物 距离 ( 物 距 ) 为 100, 则 当 镜 头 的 焦距 为 50 时 ,景深 为 多 少 ? 如 果 镜 头 的 焦 
距 为 500 呢 ? 

(2) 如 果 镜 头 的 焦距 为 100, 则 当 物 距 为 200 时 ,景深 为 多 少 ? 如 果 景 物 距离 为 
500 呢 ? 

3 解 析 : 

(1) 镜头 的 焦距 为 50, 物 距 为 100 时 ,景深 为 


2X50X10X1X100X(100 一 50) 
(WX 0 — X000— 50Y 


镜头 的 焦距 为 500, 物 距 为 100 时 ,焦距 大 于 物 距 , 只 能 成 虚像 ,景深 无 法 定义 。 
可 见 , 焦 距 的 增加 会 导致 景深 减少 ,焦距 过 大 会 使 景深 消失 。 
(2) 镜头 的 焦距 为 100, 物 距 为 200 时 ,景深 为 


_ 2x100x 10x 1 x 200 x (200— 100) 
(10X 100) — 1 X (200— 100)? 


镜头 的 焦距 为 100, 物 距 为 500 时 ,景深 为 


2Xx 100X 10 Xx 1 xX 500 x (500— 100) 
(10 X 100) — 1? X (500— 100)? 


可 见 , 物 距 的 增加 导致 了 景深 的 增加 。 


1-5 光源 照射 亮度 的 计算 





Aioo x 20. 20 





Azo0 2 40. 40 








Asoo a2 476. 19 





如 题 面 : 
如 果 已 知 一 个 路 灯 的 输出 光 通 量 为 2000lm, 那 么 在 距离 它 50m 和 100m 处 的 亮度 各 是 多 少 ? 
扣 解 析 : 

路 灯 的 发 光 强度 为 1= 鲜 一 亿 ,所 以 在 距离 .处 的 亮度 为 B 一 二 一 二 


SF Cnr5 分 别 
将 r+ 值 代入 ,得 到 














fg 2000 i y 
.0 《10 ee. 
二 
es 2 2 1.267 X 103 (cd/m’) 














(4rr)2 (4x X100)? 


1-6 ”摄像 机 运动 与 像素 亮度 变化 


如题 面 : 

设 有 两 帧 用 摄像 机 在 相 邻 时 刻 拍摄 的 图 像 ,给 出 根据 像素 亮度 变化 计算 摄像 机 运动 参 
数 的 公式 。 

气 解 析 : 


这 里 设 光 源 和 场景 都 没有 随时 间 变 化 ,像素 亮度 的 变化 仅 由 摄像 机 的 运动 而 产生 。 设 
用 zi 和 >y(z) 表 示 空 间 点 已 在 时 刻 上 的 图 像 坐标 , 则 在 t+ 十 dt 时 刻 ,P 点 所 对 应 的 新 图 像 坐 
标 为 





[| | 1 gf | [| 

一 人 上 

y(t+ dz) 一 发 ly) 请 

其 中 ,、.0.T- 和 T, 对 应 摄像 机 运动 参数 ; & 表 示 尺 度 变化 (对 应 摄像 机 与 景物 之 间距 离 的 
变化 或 变焦 操作 ); 0 表示 摄像 机 的 旋转 角 ; T, 和 T, 表示 摄像 机 的 平移 量 。 空 间 点 P 的 运 


动 速 度 为 

u dz/dt k—1 k0 wm) 1 

[小 jn 上 大 一 ed 
代入 光 流 方程 ,得 

(Ez +Ey)(k—1)+(Er— Ey RET,+E,T,+E,=0 
由 于 摄像 机 的 运动 会 导致 所 有 图 像 像素 ( 设 共 N 个 ) 发 生 相 同 的 变化 ,所 以 可 得 
EA=B 
其 中 ,E 为 NX4 的 矩阵 ,每 一 行 等 于 [LE,zx 十 E,y E,rx 一 E,y E, E,];B 为 NX1 的 矢 
量 , 每 个 元 素 等 于 一 E,; A 为 1X4 的 矢量 ,A4=[k 一 1 kT,T,]"。 由 于 EE,、E,、E, 均 可 以 从 
图 像 中 算得 ,所 以 可 以 进一步 得 到 EE 和 B。 最 后 ,利用 最 小 二 乘法 可 解 得 
A = (ETE)-!E'™B 

该 式 给 出 了 摄像 机 运动 参数 随 像素 亮度 变化 (包括 空间 变化 和 时 间 变 化 ) 的 关系 。 


1-7 结构 光 成 像 的 计算 








如 题 面 : 

有 一 个 结构 光 成 像 系 统 , 摄 像 机 焦距 4 二 0. 5m, 镜 头 中 心 到 > 和 Z 轴 交 点 的 距离 = 
lm,z 和 Z 轴 交 点 到 物体 的 距离 d= 二 2m,x 和 2Z 轴 间 的 夹 角 B 二 30"。 

(1) 如 果 一 个 注 物体 的 平面 与 成 像 平面 平行 ,其 高 度 成 像 后 的 尺寸 为 0.05m( 沿 X 轴 )， 
其 宽度 ( 沿 Y 轴 ) 成 像 后 的 尺寸 为 0. 1m, 求 该 物体 的 面积 。 

(2) 如 果 一 个 薄 物体 的 平面 与 Z 轴 垂 直 , 上 顶点 为 W 点 , 沿 Z 轴 成 像 后 的 尺寸 ( 沿 
XX 轴 ) 为 0.05m, 沿 Y 轴 成 像 后 的 尺寸 为 0. 1m, 求 该 物体 的 面积 。 

(3) 如 果 一 个 薄 物 体 平 躺 在 OYZ 平面 上 .中 心 在 W 点 , 沿 Z 轴 成 像 后 的 尺寸 ( 沿 X 轴 ) 
为 0.05m, 沿 Y 轴 成 像 后 的 尺寸 为 0. 1m, 求 该 物体 的 面积 。 

忌 解 析 : 

(1) 此 时 的 成 像 示 意图 见 图 解 1-7(1) 。 











图 解 1-7(1) 第 一 种 情况 的 结构 光 成 像 示意 图 

















由 图 解 1-7(1) 可 见 ,摄像 机 光 心 点 为 C, 轴 线 与 Z 轴 交 点 为 p,C 到 pp 的 延长 线 与 物体 
高 度 的 延长 线 交 于 4 点 。 根 据 ( 对 项 ) 相 似 三 角形 关系 ,有 





Wag 一 mm CI 

hi A 
另外 考虑 由 W 点 .p 点 及 g 点 为 项 点 的 三 角形 ,可 写 出 
Ms = sing = 去 


Wp 
由 上 式 可 解 得 Wg 二 1,pq 二 V3 ,所 以 Co= 1 十 V3 ,代入 最 前 面 的 公式 ,得 到 
.1 十 .1 十 VS 
1 = a 下 一 0.05 0.5 0.7268 






































wi 
另外 考虑 由 W 点.p 点 及 C 点 为 顶点 的 三 角形 ,可 写 出 
2 sina sin(B—7) 

r siny siny 


由 该 式 可 解 得 a 二 20. 104",Y 二 9.896"。 进 一 步 , 算 得 1 二 2sin(150°)/sin(20. 104") 一 2. 91。 
现在 考虑 Y 轴 以 及 W 点 所 在 的 平面 ,在 该 平面 的 结构 光 成 像 几 何 关系 如 图 解 1-7(2) 
所 示 ( 其 中 履 王 (2 十 妇 )22 一 0.5324) 。 








图 解 1-7(2) 第 一 种 情况 结构 光 成 像 时 的 OYZ 平面 


根据 前 面 已 算得 的 rw .上 和 4 可 进一步 算出 了 ==0.1X2.91/0.5324 二 0.5466, 即 沿 Y 轴 尺 寸 
为 1.093m。 所 以 物体 面积 为 0.7269X1.093 二 0. 7946m?。 
(2) 此 时 的 成 像 示 意图 见 图 解 1-7(3)。 





NT 








图 解 1-7(3) 第 二 种 情况 的 结构 光 成 像 示意 图 
这 里 做 辅助 线 Wg 与 pg 垂直 ,如 (1) 中 那样 算得 wi 一 0.7268。 过 wi 作 Wa 的 垂 线 , 交 








Wo 于 。 令 a 二 AuiCd , 则 tana' 一 让 人 A 一 0. 05/0. 5 一 0. 1。 令 0= Zwiwiwi, 则 因为 
LACwig = 二 90" 一 a’ 二 90" 一 B 十 9, 所 以 9 一 8 一 以 一 30" 一 5.71" 一 24. 29"。 这 样 ,wi 二 wicosB 十 
wi sinBtg0= 0. 7934。 

对 Y 的 计算 及 结果 同 (1) ,所 以 物体 面积 为 0.7934X1.093 二 0. 8672(m?)。 


(3) 此 时 的 成 像 示 意图 见 图 解 1-7(4) 。 








= 1 W(X, FD 站 ”所 





图 解 1-7(4) 第 三 种 情况 的 结构 光 成 像 示意 图 


由 图 可 见 , 物 体 以 W 为 中 点 放置 ,此 方向 尺寸 为 x 一 x 。 这 里 与 W 点 对 应 的 /一 0. 183 ,物体 
成 像 后 的 尺寸 满足 0.05 二 hs 一 hh 。 又 令 < 三 (zo 一 4)/2, 根 据 成 像 高 度 与 物体 距离 的 关系 有 











= rescB*» hi/A 二 2 一 三 2。 hi/0.5 
2 1— cotB* hi/A 2 l=/ 
£4 rescB*» h, /A 之 2。h,/0.5 
| 一 之 2 一 
《om 0 








将 上 两 式 相 加 求解 ,得 到 hh 二 0. 1524,hs 二 0.2024,z 二 1.4177( 另 一 组 解 同一 0. 2818 之 ,不 
合 题 意 ) ,所 以 沿 Z 轴 尺寸 为 2. 8354m。 
对 YY 的 计算 及 结果 同 (1) ,所 以 物体 面积 为 2. 8354X1. 093 王 3. 0991(m2? ) 。 


1-8 不 同 立 体 成 像 的 方式 





气 题 面 : 

借助 主动 视觉 .光度 立体 学 成 像 、 光 流 计算 这 几 种 方式 采集 的 图 像 有 什么 异同 ? 从 观察 
者 的 角度 看 有 什么 不 同 ? 

扣 解 析 : 

这 几 种 方式 都 需要 采集 多 幅 图 像 , 以 反映 和 利用 采集 器 光源、 景物 之 间 的 相对 变化 信息 。 

利用 主动 视觉 方式 采集 的 多 幅 图 像 可 等 效 为 采集 器 运动 到 不 同位 置 的 情况 下 而 得 到 的 
( 双 目 对 应 两 个 位 置 ,多 目 对 应 多 个 位 置 )。 观 察 者 不 仅 能 感受 到 景物 表面 的 亮度 变化 ,而 且 
能 感受 到 景物 的 空间 变化 (结构 变化 ) 。 

在 光度 立体 学 成 像 中 仅仅 考虑 了 光源 的 运动 ( 光 移 ) ,一 般 认为 采集 器 和 物体 都 是 静止 
的 。 这 样 ,观察 者 只 能 感受 到 景物 表面 亮度 的 变化 ,而 无 结构 几何 方面 的 变化 。 

借助 光 流 反映 景物 运动 的 图 像 利用 了 景物 的 运动 信息 ,首先 强调 场景 中 物体 的 运动 变 
化 ,而 光源 和 采集 器 既 可 静止 也 可 运动 。 观 察 者 能 感受 到 景物 的 空间 变化 ,但 仅 在 景物 表面 
亮度 不 同 的 边界 处 能 感受 到 变化 。 


1-9 图 像 与 理解 场景 的 信息 


气 题 面 : 
试 举例 说 明 一 幅 图 像 本 身 并 不 具备 精确 理解 客观 场景 的 全 部 信息 。 
。8 。 


气 解析 : 

如 图 解 1-9 所 示 ,如 果 仅 观察 图 像 ,可 以 给 出 两 种 解释 : 一 种 是 人 群 坐 在 平坦 的 草地 
上 ,背景 里 的 房屋 是 倾斜 的 ; 另 一 种 是 人 群 坐 在 倾斜 的 草地 上 ,背景 里 的 房屋 是 竖 直 的 。 当 
然 , 如 果 结 合生 活 常识 ,人 们 应 该 能 给 出 后 一 种 更 合理 合 情 的 解释 。 但 这 也 正 说 明 该 图 像 中 
并 没有 包含 所 有 可 以 帮助 精确 理解 客观 场景 含义 的 全 部 信息 。 








图 解 1-9 一 幅 可 能 有 歧义 的 图 像 


1-10 ”数字 弧 的 判断 


名 题 面 : 

图 题 1-10 中 的 黑 点 指示 了 采样 得 到 的 数字 化 集合 。 试 分 别 作出 该 集合 按照 4- 邻 接 得 
到 的 轮廓 和 按照 8- 邻 接 得 到 的 轮廓 。 分 别 判断 这 两 个 轮廓 是 否 是 数字 弧 。 

各 解析 : 

对 图 题 1-10 中 数字 化 集合 作出 的 4- 邻接 轮廓 和 8- 邻接 轮廓 分 别 见 图 解 1-10(a) 和 
1-10(b)。 它 们 都 不 是 数字 弧 。 考 虑 图 解 1-10(a) 第 5 行 第 4 列 那个 中 空 像素 , 它 在 轮廓 上 
有 3 个 4- 邻接 的 像素 ,所 以 该 轮廓 不 满足 数字 弧 的 条 件 。 再 考虑 图 解 1-10(b) 第 6 行 第 4 
列 那个 中 空 像素 , 它 在 轮廓 上 有 3 个 8- 邻 接 的 像素 ,所 以 该 轮廓 也 不 满足 数字 弧 的 条 件 。 

































































图 题 1-10 ”数字 化 集合 图 解 1-10 ”数字 化 集合 的 轮廓 


1-11 方 盒 量 化 和 网 格 相交 量化 


各 题 面 : 

能 否 设计 出 一 个 非 空 集合 5, 使 : 

(1) 它 在 方 盒 量 化 的 数字 化 模型 下 有 可 能 被 映射 到 一 个 空 的 数字 化 集合 中 ? 

(2) 它 在 网 格 相 交 量 化 的 数字 化 模型 下 有 可 能 被 映射 到 一 个 空 的 数字 化 集合 中 ? 

气 解 析 : 

(1) 方 盒 量 化 不 可 能 将 非 空 集合 S 映射 到 一 个 空 的 数字 化 集合 中 。 这 是 因为 所 有 像素 
的 数字 化 方 盒 的 联合 能 够 完全 覆盖 平面 ,而 且 各 个 数字 化 方 盒 不 相交 。 这 就 保证 了 S 集合 
中 的 每 一 个 实数 点 都 能 唯一 地 映射 到 一 个 离散 点 ,所 以 得 到 的 数字 化 集合 P 不 可 能 为 
空 集 。 

(2) 网 格 相交 量化 有 可 能 将 非 空 集合 S 映射 到 一 个 空 的 数字 化 集合 中 。 网 格 相交 量化 
的 结果 依赖 于 细 目 标 集合 (如 曲线 ) 与 网 格 线 的 交点 。 如 果 一 个 细 目 标 集合 S 与 网 格 线 无 
交点 , 则 在 量化 时 将 会 没有 点 被 映射 到 数字 化 集合 中 ,此 时 所 得 到 的 数字 化 集合 已 为 空 集 。 


1-12 网 格 相交 量化 的 结果 


名 题 面 : 
图 题 1-12 给 出 3 个 连续 (曲线 ) 集 合 , 试 给 出 对 它们 使 用 网 格 相交 量化 所 得 到 的 离散 
集合 。 


















































图 题 1-12 ”连续 集合 


所 解析 
使 用 网 格 相 交 量化 所 得 到 的 离散 集合 见 图 解 1-12。 





























图 解 1-12 ”由 连续 集合 得 到 的 离散 集合 


。 1]10 。 





2-D 图 像 的 基本 单元 是 像素 (3-D 图 像 的 基本 单元 是 体 素 ) 。 像 素 之 间 的 联系 有 多 种 ， 
既 有 空间 上 的 联系 ,也 有 属性 上 的 联系 。 像 素 联 系 主要 包括 邻 域 .邻接 .连接 和 连通 ,它们 各 
有 相关 但 又 不 同 的 定义 和 用 途 。 在 2-D 图 像 中 , 邻 域 分 为 4- 邻 域 \ 对 角 邻 域 .8- 邻 域 ; 邻接 
分 为 4- 邻接 8- 邻接; 连接 分 为 4- 连 接 、8- 连 接 ; 连通 分 为 4- 连通 8- 连通 。 在 3-D 图 像 
中 ,这 些 基 本 概念 都 有 很 多 推广 。 例 如 , 体 素 之 间 的 联系 有 : 6- 邻 域 .18- 邻 域 .26- 邻 域 ; 
6- 邻 接 ( 有 公共 面 )、18- 邻 接 ( 有 公共 面 或 公共 边 )、26- 邻 接 ( 有 公共 面 或 公共 边 或 公共 顶 
点 ); 6- 连 接 、18- 连 接 、26- 连 接 ; 6- 连 通 、18- 连 通 、.26- 连 通 。 许 多 图 像 处 理 操作 都 是 基于 
像素 邻 域 进行 的 。 

像素 借助 邻接 组 成 通路 ,离散 距离 在 像素 之 间 的 空间 关系 中 起 着 重要 作用 。 在 2-D 图 
像 中 ,常用 城区 距离 (4- 邻 接 距 离 ) 和 棋盘 距离 (8- 邻 接 距 离 ), 有 时 还 使 用 马 步 距 离 。 在 3-D 
图 像 中 ,它们 都 有 对 应 的 推广 。 像 素 借 助 连接 构成 连通 组 元 ,也 是 图 像 的 子 集 。 子 集 可 看 作 
图 像 中 由 像素 扩展 得 到 的 单元 ,也 可 称 为 区 域 (在 3-D 图 像 中 可 称 为 实体 )。 区 域 在 图 像 分 
析 或 图 像 理 解 中 使 用 更 频繁 。 

本 章 的 问题 涉及 上 述 像素 联系 多 个 方面 的 概念 。 


2-1 子 集 邻 接 和 连接 的 判断 











如题 面 : 
设 有 2 个 图 像 子 集 P( 浅 背景 ) 和 Q( 深 背景 ) ,如 图 题 2-1 所 示 。 
(1) 判断 子 集 P 和 子 集 Q 是 否 : 4- 邻 接 ; Pp 
@ 8- 邻 接 ; GODm- 邻 接 。 mon0m 


加 

(2) 如 果 定 义 连 接 的 灰 度 值 集 合 V 一 11} ,判断 子 99ECGSO SSE 

集 P 是 否 与 子 集 Q: O 4- 连 接 ，@ 8- 连 接 ，|! | oj | |o 同 辐 加 加。| 
加 
加 





@m- 连 接 。 gaom 

(3) 如 果 将 子 集 P 和 子 集 Q 以 外 的 所 有 像素 (无 | |o| ol lo ol 
背景 ) 看 成 男 一 个 子 集 R, 试 指出 子 集 卫 与 子 集 Q 是 否 
分 别 与 子 集 R: D 4- 连 通 ; @ 8- 连 通 ; @m- 连 通 。 

名 解析 : 

(1) 根据 邻接 定义 , 子 集 已 与 子 集 Q 之 间 具 有 4- 邻接 ,8- 邻 接 和 m- 邻 接 的 联系 。 

(2) 根据 连接 定义 , 子 集 P 与 子 集 Q 之 间 具 有 8- 连 接 和 m- 连 接 的 联系 。 

(3) 根据 连通 定义 , 子 集 P 与 子 集 R 之 间 具 有 8- 连 通 和 m- 连 通 的 联系 ; 子 集 Q 与 子 


图 题 2-1 ”两 个 图 像 子 集 


集 R 之 间 具 有 4- 连通 ,8- 连 通 和 m- 连 通 的 联系 。 
2-2 4- 通 路 和 8- 通 路 的 转换 


各 题 面 : 

设 一 条 单 像素 宽 通 路 上 的 像素 从 头 到 尾 依次 为 p。，p1,，…，p, ,如 果 定 义 连接 的 灰 度 
值 集合 V 二 {1} ,请 列 出 : 

(1) 将 一 条 8- 通 路 转换 为 4- 通 路 的 主要 步骤 。 

(2) 将 一 条 4- 通 路 转换 为 8- 通 路 的 主要 步骤 。 

气 解 析 : 

(1) 如 果 从 头 到 尾 依次 考虑 8- 通 路 上 的 两 个 相 邻 像素 p; 和 记 ix+i, 则 将 该 8- 通 路 转换 为 
4- 通 路 的 主要 步骤 为 : 

@ 判断 pit1 是 否 在 p; 的 4- 邻 域 中 ; 

@ 若是 , 则 把 pii1 替 换 为 p;, 返 回 @; 

@ 若 不 是 ,将 与 p; 和 + 都 为 4- 邻 接 联系 的 两 个 像素 之 一 的 像素 值 置 为 1( 该 像素 应 
不 在 通路 上 其 他 像素 的 4- 邻 域 中 ) ,返回 @。 

(2) 如 果 从 头 到 尾 依次 考虑 4- 通 路 上 有 一 个 像素 间隔 的 两 个 像素 p; 和 pii:, 则 将 该 
4- 通 路 转换 为 8- 通 路 的 主要 步骤 为 : 

中 判断 +? 是 否 在 p; 的 8- 邻 域 中 ; 

@ 若 不 是 , 则 将 pi+1 置 为 p;, 将 pi+s 置 为 b+ ,返回 中 ; 

@ 若是 ,将 pi+1 的 像素 值 置 为 0, 把 pi 替换 为 户 , 返 回 @。 


2-3 用 邻接 矩阵 表示 像素 之 间 的 邻接 关系 


可 以 用 邻接 矩阵 工 表 示 像 素 之 间 的 邻接 关系 。 该 矩阵 中 ,每 行 对 应 一 个 像素 ,每 列 也 
对 应 一 个 像素 。 这 样 ,每 个 为 1 的 元 素 表示 该 行 像素 与 该 列 像素 之 间 是 邻接 的 ,而 每 个 为 0 
的 元 素 表 示 该 行 像素 与 该 列 像素 之 间 是 不 邻接 的 。 现 在 考虑 ab、c 3 个 像素 ,它们 的 邻接 
矩阵 如 图 题 2-3 所 示 ,分别 画 出 4- 邻 接 和 8- 邻接 两 种 关系 下 这 3 个 像素 所 有 可 能 的 空间 排 


列 情况 。 
b 
0 a 
1 C 


图 题 2-3 ”邻接 矩阵 


扣 解 析 : 
在 4- 邻 接 的 关系 下 ,这 3 个 像素 有 12 种 可 能 的 空间 排列 ,如 图 解 2-3(1) 所 示 。 
在 8- 邻 接 的 关系 下 ,这 3 个 像素 也 有 12 种 可 能 的 空间 排列 ,如 图 解 2-3(2) 所 示 。 
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图 解 2-3(2) ”8- 邻 接 下 像素 可 能 的 空间 排列 


2-4 ”六 边 形 采 样 坐标 系 


各 题 面 : 

给 定 正方 形 采 样 坐标 系 XY 中 的 两 个 点 (1 ,2) 和 (2, 1), 则 : 

(1) 它们 在 六 边 形 采样 坐标 系 UV 中 的 坐标 是 什么 ? 

(2) 它们 在 六 边 形 采样 坐标 系 UV 中 的 距离 是 多 少 ? 

(1) 对 点 (1, 2); wx 王 一 /3 一 1 一 2/37 ,ou 一 2y/34 一 4/3142; 对 点 (2, 1); wu 二 x 一 
/3 =2—1/3 ,oo 一 2y/32 一 2/312 。 

(2) 两 个 点 之 间距 离 的 二 次 方 为 


区 育 2+ 计 ] +( 庆 ) + 全 -2+ 届 | 


所 以 两 个 点 之 间 的 距离 为 2”。 




















2-5 离散 圆 盘 


各 题 面 : 

试 分 别 画 出 : 

(1) 8- 邻 域 离散 圆 盘 A;3,,(15) 、As,4(22) 和 As, (28)。 

(2) 16- 邻 域 离 散 圆 盘 As,,1 (21) 、As,111(33)。 

各 解析 : 

(1) 8- 邻 域 离散 圆 盘 A:,(15) .A3,s (22) 和 As., (28) 分 别 如 图 解 2-5(1a) ,图 解 2-5(1b) 
。 13 。 


和 图 解 2-5(1c) 所 示 。 








图 解 2-5(1) ”8- 邻 域 离 散 圆 盘 











(2) 16- 邻 域 离散 圆 盘 As,7,u (21) 和 As (33) 分 别 如 图 解 2-5(2a) 和 图 解 2-5(2b) 
所 示 。 





(a) 
图 解 2-5(2) 16- 邻 域 离散 圆 盘 


2-6 像素 间 的 距离 和 通路 


各 题 面 : 

(1) 证 明 两 个 像素 之 间 的 D, 距离 等 于 它们 之 间 最 短 的 4- 通路 的 长 度 。 

(2) 上 述 通路 是 唯一 的 吗 ? 

扣 解 析 : 

(1) 简单 证 明 : 令 两 个 像素 p 和 g 的 坐标 分 别 为 (rx,，y) 和 (s, 7), 则 它们 之 间 的 D, 距 
离 为 : Di(p, gg) 二 |zx 一 s| 十 |y 一 t|; 而 pp 和 g 之 间 最 短 的 4- 通 路 的 长 度 应 该 是 沿 水 平方 向 
的 通路 长 度 加 上 沿 垂直 方向 的 通路 长 度 , 也 就 是 |z 一 s| 十 |y 一 t|。 

详细 证 明 : 根据 像素 之 间 通 路 的 定义 ,最 短 通路 长 度 应 是 通路 长 度 所 能 取得 的 最 小 值 。 
现在 考虑 连接 两 个 坐标 分 别 为 (z，y) 和 (s, 7) 的 像素 p 和 g 之 间 的 4- 通路 (8- 通 路 类 似 )。 
注意 ,连接 任意 两 点 (zx;， yi;) 和 (zi41，yi+1) 的 坐标 值 必 有 一 个 相等 , 即 xz; 二 zi 或 y= 二 
yit1。 而 从 像素 p 到 像素 g 的 坐标 差 值 在 两 个 方向 上 分 别 为 x 一 s 和 yy 一 :。 当 通路 长 度 为 
n 时 ,有 


Lm 
2 zm —z) 一 |z 一 s| 
| 


La 
pe —yi) =|y—t| 
二 0 
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注意 ,对 给 定 的 i,(zi#i 一 Zi) 和 (yi41 一 yi) 不 会 同时 为 零 ,但 也 不 会 同时 不 为 零 。 这 样 
一 来 ,有 nn 宇 |zx 一 s| 十 |y 一 t1|, 而 D,(p, gg) 二 |x 一 s| 十 |y 一 +| ,这 表明 两 个 像素 之 间 的 D， 
距离 等 于 它们 之 间 最 短 的 4- 通路 的 长 度 。 

(2) 上 述 通 路 并 不 是 唯一 的 (通路 长 度 并 不 能 限制 通路 上 像素 可 能 的 所 有 位 置 ) 。 


2-7 马 步 距 离 满足 测度 性 质 








名 题 面 : 

请 验证 马 步 距离 满足 距离 测度 的 3 个 条 件 。 

如 解析 : 

考虑 像素 p(zxs, ys) 和 g(xo, yo), 令 s=max[|zxp—zol, [yp—yel],t=min[|z,—zl, 
|y;s 一 ys|]。 马 步 距离 可 定义 为 


wa HS {eto me SS}, 人 


3， (s,t) = (1,0) 

4， (s,t) = (2,2) 

先 看 测度 条 件 1( 非 负 性 ): 因为 * 和 上 都 非 负 , 因 此 上 式 第 一 种 情况 中 的 两 项 都 非 负 

( 且 只 有 当 * 和 zt 都 为 零 时 这 两 项 才 都 为 零 ) ,而 且 第 二 种 情况 和 第 三 种 情况 都 非 负 , 所 以 
dr.(p, q)=0。 

再 看 测度 条 件 2( 互 换 性 ): 因为 p 和 g 互 换 后 s 和 t 都 不 变 , 所 以 di (p,qg) 二 di (gq, p)。 

最 后 看 测度 条 件 3( 三 角 不 等 式 ) : 因为 两 点 之 间 马 步 距离 的 物理 含义 是 从 起 点 按照 马 

步 方式 走 到 终点 所 需要 的 最 小 步 数 ,所 以 如 果 先 从 起 点 走 到 另 一 点 ,再 从 该 另 一 点 走 到 终点 

所 需要 的 步 数 只 可 能 大 于 或 等 于 直接 从 起 点 走 到 终点 所 需要 的 步 数 , 即 di (p, 7) 十 di (7， 
gq)d.(p, q)。 











(sst) (1,0) 








dr(p,q) = 


2-8 ”斜面 距离 与 欧 氏 距离 


如题 面 : 

(1) 给 定 3 个 点 p.g、r, 如 果 和 斜面 距离 ds.,(p, 9g) 二 ds,s(p，7), 但 欧 几 里 得 距离 (简称 欧 
氏 距 离 )de(p,g) 了 de(p， 门 , 则 称 出 现 第 一 类 拓扑 错误 。 设 (oa, 0 一 (2，3) ,分 别 计算 (0, 0) 
到 (2, 2) 和 (0, 0) 到 (0, 3) 的 两 种 距离 。 

(2) 给 定 3 个 点 .gsr, 如 果 斜 面 距离 ds,,(p, dg) 二 ds(Cp ,>) ,但 欧 氏 距 离 dr (bp，9) 一 
dz(p， 门 , 则 称 出 现 第 二 类 拓扑 错误 。 设 (e, 已 =(2, 3) ,分别 计算 (0, 0) 到 (9, 4) 和 (0, 0) 
到 (10, 1) 的 两 种 距离 。 

芯 解 析 : 

(1) 斜面 距离 : d,s(2, 2) 王 0X2 十 2X3 王 6,d.o(0，3) 一 3X2 十 0X3 一 6,d.(2，2) 一 
0 


欧 氏 距离 ds(25 DD 三 YB sde(0; =8da(23 2 2 dE 3) 


(2) 斜面 距离 : ds(9, 4) 一 5X2 十 4X3 一 22,do(10,，1) 一 9X2 十 1X3 一 21,do(9，4) 之 
das(10, 1); 
欧 氏 距离 : de(9, 4) 二 V97 ,de(10, 1)= V101 ,de(9, 4)<de(10, 1)。 


2-9 通路 长 度 的 计算 


名 题 面 : 

图 题 2-9 给 出 了 一 个 灰 度 值 为 0 一 3 的 4X6 图 像 子 集 。 

(1) 令 V 一 (0，1) ,计算 左下 角 像 素 和 右上 和 角 像 素 之 间 4- 通 
路 8- 通路 和 m- 通 路 的 长 度 。 

(2) 令 V={1, 2}, 仍 计算 上 述 3 个 通路 的 长 度 。 





气 解 析 ， 
(1) 在 V={0, 1}) 时 ,p 和 g 之 间 4- 通 路 的 长 度 为 = ,8- 通 图 题 2.9 计算 通路 长 度 的 
路 的 长 度 为 5,m- 通 路 的 长 度 为 6。 图 像 子 集 


(2) 在 V={1, 2) 时 ,p 和 g 之 间 4- 通 路 长 度 为 8,8- 通 路 的 
长 度 为 6,m- 通 路 的 长 度 为 8。 


2-10 不 同 邻接 情况 下 的 通路 长 度 


气 题 面 : 
通路 长 度 与 所 采用 的 邻接 方式 有 关 。 给 定 如 图 题 2-10 所 示 的 图 像 , 设 允 许 相 邻 两 个 像 
37 30 28 24 31 30 33 34 素 之 间 的 最 大 灰 度 差 为 5， 


33 35 21 22 35 27 21 37(g) (1) 标 出 根据 4- 邻 接 情况 所 确定 出 的 和 4g 两 
24 38 30 21 25 24 31 33 点 之 间 的 最 短 4- 通 路 ,并 给 出 其 长 度 。 
(p)30 34 28 25 26 22 23 27 (2) 标 出 根据 8- 邻 接 情 况 所 确定 出 的 p 和 g 两 


图 题 2-10 ” 需 确定 通路 长 度 的 图 像 ”点 之 间 的 最 短 8- 通 路 ,并 给 出 其 长 度 。 
各 解 析 : 
(1) 最 短 4- 通 路 见 图 解 2-10(a) ,长 度 为 15。 
(2) 最 短 8- 通 路 见 图 解 2-10(b) ,长 度 为 8。 
Ey P22 31 省 37 30 28 24 31 30 33 34 


33 和 21 22 35 27 21 37(g) 站 35; 2 22 5 pt 37(g) 
24 38 30 2l-*25-24 31 33 24 38 30 21 25 24 si 了 
(D)30-*34 28 25 26 22 23 27 (pp)30%34 28 25 26 22 23 27 
(a) (b) 


图 解 2-10 由 不 同 邻 接 方式 确定 出 的 通路 
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形态 变换 是 一 类 将 平面 区 域 映射 到 平面 区 域 的 变换 。 它 可 将 一 个 组 合 区 域 映 射 为 另 一 
个 组 合 区 域 , 将 单个 区 域 映 射 为 一 个 组 合 区 域 ,或 将 一 个 组 合 区 域 映 射 为 单个 区 域 。 这 里 原 
始 平面 区 域 和 目标 平面 区 域 可 以 共 面 也 可 以 不 共 面 。 在 前 一 种 情况 下 ,变换 时 仅 涉及 2-D 
空间 ; 而 在 后 一 种 情况 下 ,变换 要 涉及 3-D 空间 。 对 2-D 图 像 的 坐标 变换 就 是 在 2-D 空间 
中 的 形态 变换 ,而 图 像 采集 过 程 中 的 成 像 所 采用 的 投影 变换 实现 的 就 是 3-D 空间 向 2-D 空 
间 的 转换 。 

场景 中 的 景物 点 有 一 定 的 3-D 空间 位 置 ,将 它们 投影 就 得 到 2-D 图 像 。 图 像 中 的 每 个 
像素 有 一 定 的 2-D 空间 位 置 , 改 变 它们 的 位 置 就 会 改变 图 像 的 外 观 。 对 图 像 的 坐标 变换 是 
靠 对 每 个 像素 改变 其 坐标 来 实现 的 。 坐 标 变换 的 种 类 很 多 ,最 一 般 的 形式 是 投影 变换 , 它 确 
定 的 是 投影 中 的 坐标 变换 。 仿 射 变 换 是 一 种 特殊 的 投影 变换 ,在 2-D 空间 进行 ,其 特例 又 包 
括 相 似 变 换 、 等 距 变 换 、 平 移 变换 ,旋转 变换 、 放 缩 变 换 、 剪 切 变换 等 。 它 们 都 可 将 原来 在 一 
定位 置 的 像素 转移 到 另外 的 位 置 。 这 些 变 换 可 以 组 合 级 联 ,也 可 以 有 反 变 换 。 

本 章 的 问题 涉及 上 述 形态 变换 多 个 方面 的 概念 。 


3-1 齐 次 坐标 直线 交点 





气 题 面 : 

给 定 如 下 两 条 齐 次 坐标 表示 的 直线 ,计算 它们 的 齐 次 坐标 交点 : 

(1) 五 一 [3，2，1]7 ,并 :一 [一 1, 0，] 本 。 

(om 0 rs Ll 0 1 

要 解析 : 

(1) 齐 次 坐标 交点 可 用 一 个 3X1 的 矢量 w 来 表示 , 它 应 该 满足 Liw 二 0 和 Liw 二 0。 换 
句 话 说 ,矢量 w 与 两 条 直线 均 正 交 。 所 以 ,要 确定 与 L, 和 都 正 交 的 矢量 w, 可 计算 L 和 
Lz 的 叉 积 : 








和 : 2 
有 一 二 | 汪 ' 交 -| 
| 2 
(2) 如 上 计算 L 和 的 叉 积 : 
Nl， 0 
w=LXL:= |3 0 -| 
| 0 








注意 ,这 里 交点 在 无 穷 远 处 ,因为 w 的 最 后 一 个 分 量 为 0。 这 也 表明 L, 和 工 ; 是 平行 的 。 


3-2 齐 次 坐标 的 几何 解释 





各 题 面 : 
试 结合 图 像 成 像 给 出 齐 次 坐标 的 一 个 直观 的 几何 解释 。 
名 解析 : 

见 图 解 3-2, 成 像 平 面 对 应 z==1 的 平面 。 齐 次 
坐标 内 一 [Az, ky,， kJ" 中 的 上 确定 了 一 条 通过 坐标 
系 原点 的 射线 , 它 所 对 应 的 像 点 w= 二 [z+，y]" 是 它 与 
成 像 平面 的 交点 。 

图 解 3-2 的 表达 还 可 以 表示 处 在 无 穷 远 处 的 点 
0 点 )。 例 如 , 齐 次 坐标 v= 二 [0, 1, 0] 定义 > 

一 条 平行 于 x 二 1 的 平面 的 射线 ( 它 永 远 与 该 平面 图 解 3-2” 齐 次 坐标 的 几何 解释 
Pn 它 表 示 沿 方向 [0, 1J" 在 无 穷 远 的 点 。 


3-3 ”单位 正方 形 的 剪 切 变换 








如 题 面 : 

给 定 如 图 题 3-3(a) 所 示 的 单位 正方 形 ABCD, 对 它 的 5 种 剪 切 变换 依次 为 : 图 
题 3-3(b) 水 平 剪 切 ,图 题 3-3(c) 垂 直 剪 切 , 图 题 3-3(d) 组 合 剪 切 ,图 题 3-3(e) 先 水 平 剪 切 
再 垂直 前 切 , 图 题 3-3(f) 先 垂直 剪 切 再 水 平 剪 切 。 请 给 出 5 种 情况 下 B.C、D 的 坐标 ,以 及 
直线 AB、AC、AD 的 斜率 。 


所 品 昌 名 所 把 




















本 
图 题 3-3 ”单位 正方 形 及 其 剪 切 变换 结果 
气 解 析 : 
对 5 种 剪 切 变换 计算 的 结果 归纳 在 表 解 3-3 中 。 
表 解 3-3 ” 剪 切 变形 结果 数据 

图 B 要 D Sm Sa Sn 
(b) | (1, 0) (1+h, 1) (v, 1) 0 1/(1+h) 1/h 
(c) (1, v) (1, 1+v) (0, 1) v l+v co 
(d) | (1，z) (1+h, 1+v) (v, 1) v (1+w)/(+h) 1/h 
(e) (1, v0) (1+h, 1+hvt+v) (h, 1+hv) | v (1+hvtv)/(1+h) (1+hv)/h 
《全 (1+hv, v) | (1 十 i 十 ho， 1 +v) | (v, 1) v/(1+hv) | (t+)/Q+h+hv) 1/h 




















3-4 不 同 坐 标 变换 实现 相同 功能 












































名 题 面 : 
试 仅 单独 使 用 平移 变换 、 尺 度 变换 ( 放 缩 变换 ) 或 旋转 变换 将 图 像 点 (1, 2) 变 换 到 
(4, 4) 处 。 
各 解析 : 
4 2 Wl 入 0 痢 
平移 变换 : 解 | 4|=|0 1 工 ,|| 2|, 得 到 工 ,==3,7T, 二 2, 所 以 变换 矩阵 T=|0 1 中 
0 0 1 0 OF 1 
4 5S Vv 
尺度 ( 放 缩 ) 变 换 : 解 | 4 -| S， 0 || 2 |, 得 到 S.=4,S,=2, 所 以 变换 矩阵 
| 和 站 也 
4 0 0 
-| 2 Os 
信人 本 可 
旋转 变换 : 选取 (2.5， pe 解 


一 Siny cosy 0 
0 0 1 








cosy siny "| 


3 

4 0 
Wi 

| 0 0 

1 一 必 量 
0 0 | 1 


得 到 cosy 王 一 1,siny 王 0, 所 以 变换 矩阵 


1 0 和 5 一 和 Ol 9 = := 0 
R= | 1 3 | @ = 路 有 二 |- | | 
0 0 1 0 dO LLY 0 1 0 0 

3-5 仿 射 变 换 的 作用 /功能 


各 题 面 : 

为 什么 利用 仿 射 变换 可 将 一 个 圆 映射 为 一 个 椭圆 ,但 不 能 将 一 个 椭圆 映射 为 一 条 双 曲 
线 或 一 条 抛物 线 ? 

解析 1: 
因为 仿 射 变换 矩阵 的 各 个 元 素 都 是 有 限 数 , 所 以 它 只 能 将 有 限 点 映射 为 有 限 点 。 圆 和 
椭圆 上 像素 点 的 坐标 都 是 有 限 的 ,而 双 曲 线 和 抛物 线 上 像素 点 的 坐标 会 延伸 至 无 穷 远 处 ,所 
以 利用 仿 射 变换 可 将 圆 映射 为 椭圆 而 不 能 将 圆 映射 为 双 曲 线 或 抛物 线 。 

解析 2: 

仿 射 变换 是 平移 、 旋 转 和 非 各 向 同性 缩放 的 组 合 。 平 移 和 旋转 都 不 会 改变 目标 形状 。 
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不 同方 向 的 缩放 只 能 改变 目标 的 对 称 性 或 尺寸 比 , 所 以 圆 只 可 能 被 映射 为 一 个 椭圆 。 缩 放 
不 会 改变 目标 轮廓 的 封闭 性 质 , 所 以 圆 不 可 能 被 映射 为 双 曲 线 或 抛物 线 这 样 不 封闭 的 几何 
解析 3: 
仿 射 变换 的 一 般 表达 式 可 以 写 为 


qr = anpr Tarpy Ti 














qy = aapr Tazpy tty 








从 中 可 解 得 
p Q22gz A12qy — G22ts Qty 
= 
Q11422 、 Q12Q21 
daqr — Augqy — aatr— auty 
py 








dl2d21 QI1Q22 
代入 圆 方程 p.* 十 py,’ 二 ,得 


2 2 
(ee 】 | (2 —aatr—ant ) Er 
QI11Q22 QI12Q21 QI12Q21 QI11Q22 


这 是 一 个 椭圆 方程 ,所 以 仿 射 变换 可 以 将 圆 映 射 为 椭圆 ,但 也 仅 能 映射 为 椭圆 。 


3-6 仿 射 变换 下 的 线段 长 度 比 





气 题 面 : 

(1) 证 明 两 条 平行 线段 的 长 度 比 在 仿 射 变换 下 不 会 发 生变 化 。 

(2) 证 明 两 条 不 平行 线段 的 长 度 比 在 仿 射 变换 下 会 发 生变 化 。 

如 解析 : 

(1) 设 两 条 平行 线段 分 别 为 p 和 ps。 因为 它们 平行 ,所 以 应 有 pi 二 kps。 根 据 仿 射 变 
换 式 g 二 Hap 可 得 : qs 一 HAps 和 gq 二 Hapi 二 KRHAps, 即 qi 一 kqg,;。 可 见 两 条 平行 线段 的 长 
度 比 在 仿 射 变换 下 没有 发 生变 化 。 

(2) 设 两 条 不 平行 线段 分 别 为 ps 和 ps 。 它 们 上 面 的 点 在 仿 射 变换 后 分 别 为 

CC anpsr T a psy T tar 








gs3y = a2ipsr 十 a22p3y 十 tay 











anpsr 十 a pay 十 tar 


qsy = Q2l 轧 tz 十 azz 力 yy 十 zy 


它们 的 长 度 分 别 为 





(aunpsz 十 a1z psy 十 ta 十 (ai 入 :十 azz psy 十 i 

















(anpsazt arp taz) + (anpaz 十 azz 力 ty 十 Be) 
要 使 两 条 线段 的 长 度 比 不 变 , 应 该 有 
(anpsz + a pay 十 tar)? + (az par 十 az2 pay 十 ta ): piz 十 ps, 
(anpsz apay 十 taz) + (an pss azz pry + tsy)” 力 4 十 py 
如 果 令 ui 一 0 一 az 一 cz 一 1 到 =0 并 代入 上 式 ,得 到 par/ pay 二 prz/ Psy， 这 表明 ps 和 
ps 平行 ,与 先前 的 假设 矛盾 。 由 此 可 见 , 两 条 不 平行 线段 的 长 度 比 在 仿 射 变换 下 会 发 生变 化 。 
本 












































也 题 面 : 
仿 射 变换 矩阵 可 看 作 : 
(1) 使 用 平移 量 (Xe，Yv ) 进 行 平移 变换 的 和 矩阵。 

(2) 用 S; 和 S, 沿 X 和 Y 轴 进行 放 缩 变换 的 矩阵 。 
(3) 用 7Y 角 绕 Z 坐标 轴 进 行 旋转 变换 的 通用 矩阵 。 
试 分 别 写 出 对 应 上 面 3 种 变换 时 变换 和 矩阵 中 参数 oa ,az ,az ,az ,tz ,ty 的 各 自 取 值 。 
名 解析 : 


(村 


3-7 仿 射 变换 矩阵 的 参数 








F 移 变换 : a 





(2) 放 缩 变换 : an 
(3) 绕 Z 坐标 轴 旋 转变 换 : an 


1,al 一 0,azi 一 0,azz 一 0 太一 Xot 一 Yo。 





Sr,a12 =0,a2 





0,az =S,,t, 


Qs =0 











COSY ,a12 = siny ,a21 


sinY,azs =cOsy ,t=0,t,=0。 


3-8 ”投影 变换 及 其 特例 的 特点 对 比 


气 题 面 : 
试 比较 投影 变换 及 其 特例 ,包括 仿 射 变换 .相似 变换 、 等 距 变 换 . 欧 氏 变 换 的 一 些 特点 。 
如 解 析 : 
表 解 3-8 对 比 列 出 了 这 些 变换 的 一 些 性 质 和 特点 。 在 表 解 3-8 中 ,矩阵 A 二 [ai ] 是 一 


个 2X2 的 非 奇异 矩阵 ; R=[7] 是 一 个 2X2 的 旋转 矩阵 ; T= [t,tyJ' 是 一 个 2X1 的 平 





移 矢 量 ; 2 一 [ti 心 本 是 一 个 2X1 的 矢量 ,u 是 一 个 标量 (因为 w 可取 零 值 ,所 以 并 不 总 可 
以 对 矩阵 进行 尺度 变换 以 使 “等 于 1)。 它 们 的 组 合 给 出 一 个 3X3 的 投影 变换 矩阵 P。 


表 解 3-8 ”投影 变换 及 其 特例 的 性 质 和 特点 对 比 



































变换 
性 质 
投影 变换 仿 射 变换 相似 变换 等 距 变换 欧 氏 变换 
茵 亚 者 时 SR 了 eR 7 了 县 盾 
变 欣 垂 亩 | [| [or 1] [or 1] [os jj [es 训 
变换 矩阵 的 行 R'R=I, RTR=I, 
换 缘 T 及 一 一 
| a | dd | d=t Wp 
投影 变换 的 | 仿 射 变换 的 | 相似 变换 的 
变换 层次 | 最 一 般 ee es 等 距 变换 的 特例 
独立 参数 | 8 6 4 4 3 
保持 区 域 中 两 
Pom 旋转 和 非 各 向 | 保持 角度 不 变 平移 和 旋转 的 
全 兴 | 由 由 实 殉 同性 放 缩 和 形状 相似 ee 组 合 





六 
































变换 
性 质 
投影 变换 仿 射 变换 相似 变换 等 距 变 换 欧 氏 变换 
bd 区 ba 也 bg 
对 正方 形 
变换 后 的 本 | 中 四 _ 
结果 示例 x 3 堵 守 区 
投影 不 变量 十 
人 
二 共 线 性 ,切线 ，| 长 应 全， 下 人 仿 射 不 变量 十 | 仿 射 不 变量 十 | 仿 射 不 变量 十 长 
交叉 比 配 比 ,矢量 重 | 角度 ,十 长 度 比 | 长 度 ,十 面积 | 度 ,十 面积 
心 的 线性 组 合 
原始 平行 直线 | 保持 直线 的 平 | 保持 直线 之 问 | 保持 直线 的 长 | 操持 直线 的 长 
行 关系 但 不 保 | 角度 及 直线 的 | 度 .直线 之 间 角 
变换 结果 | 可 能 变 成 汇聚 度 \ 直 线 之 间 角 
持 秋 直 关系 ,加 | 平行 关系 和 委 | 度 和 区 域 的 面 | 庆 避 区 域 大 面积 
变 成 椭圆 直 关 系 积 ,可 反 向 
3-9 图 像 平 面 与 世界 坐标 系 的 映射 
各 题 面 : 


图 像 采集 时 ,世界 坐标 系 中 的 一 个 3-D 点 会 投影 变换 为 图 像 平面 上 的 一 个 2-D 点 。 为 
什么 道 投影 变换 不 能 将 图 像 平 面 上 的 一 个 2-D 点 唯一 地 映射 到 世界 坐标 系 中 的 一 个 3-D 点 
上 ? 讨论 一 下 当 满足 什么 条 件 时 这 种 情况 变 为 可 能 (可 画 一 个 示意 图 帮助 解释 和 讨论 ) 。 

扣 解 析 : 

投影 变换 将 处 在 空间 点 (X,Y, Z) 到 镜头 中 心 (0, 0, 1) 的 射线 上 的 所 有 世界 坐标 系 中 
的 3-D 点 都 投影 到 图 像 平 面 上 的 同一 个 点 (x,y) 上 ,如 图 解 3-9 所 示 。 反 过 来 说 ,点 (xz, y) 
对 应 射线 上 所 有 的 3-D 点 ,并 不 能 借助 逆 投 影 变 换 唯一 地 对 应 或 确定 出 任何 一 个 3-D 点 。 





空间 点 


,2) 





图 解 3-9 投影 变换 示意 图 


SS 


如 果 已 经 知道 投影 到 图 像 平面 点 (z, y) 的 空间 点 的 Z 坐标 , 则 可 以 确定 该 点 的 XX 坐标 


机 过 入 局 








和 工 坐标 。 更 一 般 地 说 ,如 果 知 道 了 空间 点 的 3 个 坐标 之 一 :那么 另 两 个 坐标 点 也 是 可 以 
确定 的 。 


3-10 3-D 投影 几何 和 变换 不 变量 


名 题 面 : 

试 比较 空间 中 的 投影 变换 及 其 特例 ,包括 仿 射 变换 、 相 似 变 换 、 欧 氏 变 换 的 几何 性 质 不 

气 解析 : 

先 给 出 各 类 变换 及 其 不 变性 质 在 2-D 空间 中 的 情况 ,如 表 解 3-10(1) 所 示 。 在 表 中 ,下 
面 的 变换 是 上 面 变 换 的 特例 ,并 继承 了 上 面 变换 的 不 变性 质 。 表 中 的 变形 列 给 出 了 对 正方 
体 的 典型 变换 效果 。 表 中 列 在 上 面 的 变换 可 以 产生 其 下 变换 的 所 有 效果 。 例 如 ,投影 变换 
可 将 正方 形变 换 成 任意 的 四 边 形 (只 要 没有 3 个 点 共 线 ) ,而 欧 氏 变换 只 能 将 正方 形 平移 或 
旋转 。 


表 解 3-10(1) 常见 变换 中 2-D 空间 不 变量 的 性 质 





变换 和 矩阵 变形 不 变性 质 /不 变量 
th 短 共 点 性 , 共 线性 ,接触 的 阶 : 交点 (1 阶 ); 切 点 
投影 8 个 自由 度 kb by | 人 dd (2 阶 ); 拐点 (3 阶 ); 切线 间断 性 和 对 应 性 。 交 
hs 叉 比 (长 度 比 的 比 ) 





au Qi2 tr a ie 
平行 性 ,面积 比 , 共 线 或 平行 线 线段 的 长 度 比 
We 区 a “| 加 NN (如 中 点 ) ,矢量 的 线性 组 合 (如 重心 ) 





Srii Sriz t. 

相似 4 个 自由 度 区 i | Li [ 长 度 比 ,角度 
rn rn t 

欧 氏 3 个 自由 度 . ra “| 人 > 长 度 , 面 积 
0 0 


接 下 来 给 出 投影 变换 及 其 特例 在 空间 中 的 情况 ,如 表 解 3-10(2) 所 示 。 这 里 每 个 特例 
都 是 一 个 子 组 ,并 且 可 以 用 和 矩阵 形式 或 等 价 的 不 变量 来 确定 。 表 解 3-10(2) 仅 给 出 在 3-D 
空间 中 变换 比 在 2-D 空间 中 变换 多 出 来 的 性 质 (3-D 空间 中 变换 所 具有 的 不 变量 仍 有 表 解 
3-10(1) 所 给 出 的 对 应 2-D 空间 中 变换 的 那些 不 变量 )。 在 表 解 3-10(2) 中 ,和 矩阵 4 是 一 个 
3X3 的 非 奇异 矩阵 ; R 是 一 个 3X3 的 非 奇 异 和 矩阵; T 一 [zz zy， tj]" 是 一 个 3X1 的 平移 矢 
量 ; v 是 一 个 3X1 的 矢量 ; u 是 一 个 标量 ; 0 二 [0, 0,，0 本 是 一 个 3X1 的 零 矢量 。 表 
解 3-10(2) 中 变形 列 给 出 对 立方 体 的 典型 变换 效果 。 表 中 列 在 上 面 的 变换 可 以 产生 其 下 变 
换 的 所 有 效果 。 只 要 没有 3 个 点 共 线 或 4 个 点 共 面 , 则 投影 变换 可 将 任意 5 个 点 变换 到 任 
意 其 他 5 个 点 。 
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表 解 3-10(2) 常见 变换 中 3-D 空间 不 变量 的 性 质 











国 ， 绝对 圆锥 曲线 






变 换 组 矩阵 变形 不 变性 质 

投影 15 个 自由 度 [人 "] A 相 接触 曲面 的 交点 和 切线 。 高 斯 曲率 的 符号 
u 

仿 射 12 个 自由 度 [ '] me / 平面 的 平行 性 ,体积 比例 ,重心 。 无 穷 远 平面 


相似 7 个 自由 度 [sr .| 














欧 氏 6 个 自由 度 [a | 曾 ， 体积 


在 投影 变换 的 15 个 自由 度 中 ,7 个 有 关 相 似 变 换 (3 个 旋转 ,3 个 平移 ,1 个 为 各 向 同性 
放 缩 ),5 个 有 关 仿 射 放 缩 ,3 个 有 关 变 换 的 投影 。 刻 画 上 述 变 换 常 根据 两 点 进行 : 平行 性 和 
角度 。 例 如 ,经 过 仿 射 变换 ,原来 平行 的 线 保持 平行 ,但 角度 发 生变 化 ; 而 经 过 投影 变换 , 平 
行 性 就 消失 了 。 





3-11 透视 投影 中 的 歧义 


各 题 面 : 

使 用 透视 投影 或 弱 透 视 投影 时 ,对 图 像 中 不 同 点 的 判断 会 出 现 姿态 歧义 (目标 朝向 ) 的 
问题 。 试 列 出 各 种 歧义 情况 ,注意 需要 既 考 虑 共 面 点 也 考虑 非 共 面 点 ,并 明确 在 每 种 情况 下 
如 果 目 标点 的 个 数 为 无 穷 时 各 有 几 种 歧义 ,举例 说 明 。 

如 解析 : 

这 里 产生 歧义 的 原因 是 由 于 目标 点 都 共 面 时 相对 于 视线 的 正 倾斜 和 负 倾 斜 区 分 不 开 ， 
即 cos( 一 Qa) 二 cosa。 所 以 如 果 增 加 共 面 的 点 并 不 带 来 新 信息 (因为 新 点 的 位 置 可 从 已 有 点 
推断 出 来 ) ,也 不 能 解决 歧义 问题 (甚至 在 目标 点 个 数 为 无 穷 时 ) 。 如 果 增 加 的 点 与 其 他 己 有 
点 不 在 同一 平面 , 则 区 分 一 a 和 a ,就 可 以 消除 歧义 。 

下 面 进一步 对 共 面 情况 和 非 共 面 情况 分 别 举例 讨论 。 

(1) 共 面 情况 下 的 姿态 歧义 。 

Q@ 两 个 点 的 姿态 歧义 。 当 两 个 目标 点 成 像 如 图 解 3-11(1a) 所 示 时 ,无 法 确定 这 两 个 点 
距离 观察 者 的 相对 远近 , 即 无 法 判断 三 角形 点 距离 观察 者 近 还 是 圆 形 点 距离 观察 者 近 。 


局 个- 本 
a 
A a sp Gr 
(a) (b) (9) 


图 解 3-11(1) 共 面 时 的 歧义 情况 
@ 3 个 点 的 姿态 歧义 。 当 3 个 目标 点 成 像 如 图 解 3-11(1b) 所 示 时 ,无 法 确定 这 3 个 点 
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所 组 成 图 形 的 开口 方向 ,所 以 无 法 判断 是 三 角形 点 距离 观察 者 最 近 , 还 是 圆 形 点 距离 观察 者 
最 近 ,或 是 正方 形 点 距离 观察 者 最 近 。 

@ 共 面 多 个 点 的 姿态 歧义 。 当 共 面 4 个 目标 点 成 像 如 图 解 3-11(1c) 所 示 时 ,四 边 形 的 
朝向 仍然 无 法 确定 ,所 以 也 就 无 法 确定 4 个 点 中 哪个 距离 观察 者 最 近 。 同 理 , 当 共 面 点 为 5 
个 或 更 多 时 ,仍然 无 法 确定 这 些 点 为 顶点 的 多 边 形 的 朝向 。 

(2) 非 共 面 情况 下 的 姿态 歧义 。 

一 个 点 与 其 他 点 不 共 面 的 姿态 歧义 。 当 4 个 目标 点 成 像 如 图 解 3-11(2a) 所 示 时 ,无 
法 确定 中 间 那 个 圆 形 点 相对 于 其 他 3 个 点 组 成 的 平面 ( 纸 面 ) 是 在 纸 面 里 还 是 在 纸 面 外 。 





图 解 3-11(2) ” 非 共 面 时 的 歧义 情况 


推广 一 下 , 当 一 个 点 不 在 其 余 点 组 成 的 平面 上 时 ,也 会 出 现 姿态 歧义 。 如 图 解 3-11(2b) 
中 ,也 无 法 确定 中 间 那 个 圆 形 点 相对 于 其 他 4 个 点 组 成 的 平面 ( 纸 面 ) 是 在 纸 面 里 还 是 在 纸 
面 外 。 

@ 多 点 不 共 面 的 姿态 歧义 。 图 解 3-11(2c) 中 对 各 个 点 不 施加 共 面 的 限制 ,但 也 会 出 现 
姿态 歧义 。 如 果 无 法 确定 中 间 那 个 圆 形 点 或 上 方 那个 椭圆 形 点 相对 于 其 他 点 的 深度 , 则 也 
无 法 确定 这 两 个 点 间 连 线 的 朝向 。 如 果 再 增加 的 点 与 原来 的 点 共 线 或 共 面 , 则 这 种 歧义 姿 
态 的 问题 不 能 得 到 解决 。 


。25 。 





图 像 变 换 在 这 里 代表 对 图 像 在 不 同 空间 之 间 进 行 的 转换 。 变 换 是 一 种 映射 , 它 可 将 图 
像 从 一 个 空间 映射 到 另 一 个 空间 。 为 了 有 效 和 快速 地 对 图 像 进行 加 工 , 常 常 需 要 将 原 定义 
在 图 像 (坐标 ) 空 间 的 图 像 以 某 种 形式 转换 到 另外 一 些 空间 中 ,并 利用 在 这 些 空间 的 特有 性 
质 方便 地 进行 一 定 的 操作 ,最 后 再 转换 回 图 像 空 间 以 得 到 所 需 的 加 工效 果 。 常 见 的 变换 包 
括 傅 里 叶 变 换 、 沃 尔 什 /哈达 玛 变 换 . 斯 拉 特 变换 、 离 散 余 弦 变 换 、 拉 东 (Radon) 变 换 、 盖 伯 
(Gabor) 变 换 、 哈 尔 变换 .小 波 变 换 、 哈 夫 (Hough) 变 换 、 霍 特 林 (Hotelling) 变 换 等 。 

许多 变换 可 借助 矩阵 形式 来 表示 ,如 果 一 个 变换 矩阵 可 以 分 解 成 为 若干 个 具有 较 少 元 
素 的 矩阵 的 乘积 , 则 常常 可 以 减少 表达 的 元 余 , 既 便于 理解 也 可 减少 操作 次 数 。 

本 章 的 问题 涉及 上 述 图 像 变换 多 个 方面 的 概念 。 


4-1 奇偶 函数 





名 题 面 : 

每 个 实 函 数 f(x) 都 可 以 分 解 成 为 1 个 奇 函 数 fwa(z) 和 1 个 偶 函 数 六 oz) 的 (加 
权 ) 和 。 

(1) 证 明 As(z) 一 LFGz) 十 太一 z)]/2, Faa(z) 一 [LFCz) 一 帮 (一 z)]/2。 

(2) 证 明 F[ Fe(z)] 一 Re{FLFCz)]},FLFa(Cz)] 一 jIm(FLFCz)])。 

忌 解 析 : 

(1) 由 f(z)== fon(z) 十 fwa(zx) ,得 到 

六 一 五 = fam(— 7)+ fa(~—7) = furalr) i foa(— 7) = femalr) — foni(z) 

将 f(x) 和 f( 一 x) 相 加 ,得 














foen 7) = [f(z) 十 (一 z)]/2 
将 f(z) 和 f( 一 x) 相 减 ,得 
Juaa(z) = [LFCz) 一 大 一 zZ)]/2 
(2) 根据 共 扼 对 称 性 .有 
天 成 了 条 三 区 ”0 = Mw) 
利用 (1) 中 的 结果 ,有 
FLfowa Cz) = FLf C7) 十 太一 z)]/2) = [FG)+F’ (4)]/2 = Re{ FLf Cz))} 
同 理 , 有 
FLfua(z)] = FLf Cz) — Ff 7]/2} = [FG00) —F* Go]/2 = jIm{FLf(z)))} 











4-2 傅 里 时 变换 对 的 平移 性 质 


名 题 面 : 

试 证 明 下 面 两 个 傅 里 叶 变换 对 的 平移 性 质 成 立 : 

(1) F(Cz,y)exp[j2x(xoz 十 my)/N] 全 F(Cx 一 xu 一 oo) 。 
(2) F(z 一 zoyy 一 ‰%) 仿 Fu)exp[ 一 j2rx(xzo 十 yo)/N]。 


名 解析 : 
(1) SF{f(xr,y)exp[Lj2r (uxt vy)/N]} 
=1 1 Si jer, y)exp[Lj2x(uoxzt voy)/NJexp[— j2x(uz + vy)/N] 
z=0 y=0 
SS 
= > fz, y)exp{ 一 j2x[(x 一 zxo)z 二 (一 z)y]/N)} 
z=0 y=0 


= F[(u—u), (v— wo)] 
(2) F{f(z— zosy— yo)} 


= DY DFOu,vexp{j2r[Lulr — zxo) +v(y— yo)J/N} 
*\ u=0 v=0 
1 N-1 N— 
= Feel 一 j2x[Lur。 + vyo J/N}exp{j2r[Luz + vy J/N} 


u=0 


一 ee —j27x[Luzo + vyo J/N} 
4-3 函数 的 傅 里 时 变换 公式 


气 题 面 : 

给 定 函 数 F(z，y) 一 瓦 exp{ 一 rLCz/e)2 十 (y/0)2]) 。 

(1) 写 出 它 的 傅 里 叶 变 换 公式 。 

(2) 计算 它 的 傅 里 叶 变 换 公式 在 原点 的 值 , 并 借 此 验证 变换 公式 的 正确 性 。 

气 解 析 : 

(1) Fl(u, v)= Habexp{—™ [(au)’++ (bv)’ ]}., 

(2) 由 上 式 可 得 到 F(0, 0) 二 HHlab|, 它 正 是 高 斯 函数 Hexp{ 一 x[ (zx/a)? 十 (y/6)?]} 下 
的 体积 。 


4-4 沃 尔 什 变换 计算 


名 题 面 : 
对 沃 尔 什 变换 W(w) ,以 N= 二 4 为 例 ,验证 下 面 两 个 关系 式 (Woen (ww) 为 偶 函 数 ,W oa(u) 
为 偶 函 数 ): 


WD) = 二 [Wewa C0) Wt 








WOu +t N/2) = EL WoC) 一 Wo] 


所 解析 : 
在 N=4 时 , 沃 尔 什 变换 核 的 数值 如 表 解 4-4 所 示 ( 正 负 号 分 别 代表 十 1 和 一 1): 


表 解 4-4 沃 尔 什 变换 核 


























沁 0 1 2 3 
0 RE 十 十 十 
1 十 年 EE a 
2 十 加 十 一 
3 十 = = 备 


取 x 王 0 进行 验证 : 


W(0) = 二 Ef(0) 十 f(D 二 fC2) 十 f(3)] = 记 [fC0) 十 fC2)] 十 二 [FC1) 十 fC3)] 





S| ~ 











W(2) = TEfC0) — f(D + FD — 3)] = 二 [fC0) +f(2)]— 二 [fF() + f(3)] 


4-5 哈达 玛 变换 矩阵 


所 题 面 : 
险 达 玛 变换 具有 迭代 性 质 , 试 借 此 写 出 N=4 阶 的 哈达 玛 矩阵 。 
名 解析 : 
险 达 玛 变换 的 选 代 性 质 可 以 用 M 阶 和 矩阵 互 w 与 2M 阶 矩 阵 甩 sw 之 间 的 下 列 迭 代 关系 
-区 人 
2M 一 读 一 天 
因为 ,=| | 本 
1 1 业 1 
名 | 针 一 1 一 1 
六 二 = 
五 —H; 1 1 = 一生 
0 1 
4-6 斯 拉 特 变换 矩阵 
也 题 面 : 
试 写 出 N 一 8 阶 的 斯 拉 特 变换 矩阵 。 
解析 : 
先 计算 变换 系数 ， 


w 



































3X82 1/2 4 2 一 4 1/2 5 
on = [zg —D J 一 1 
令 
贡 抽 "| | 0 ] 
而 
大 | l "| | 1 0 | 
” |- anj [— vy572T 4/ Val 
| i "| | 1 0 | 
” [ao 6n| [4 val V5731 
[2 | | 0 = | 
” Law an Lv572T 4/V 开 
i 1 1 1 
» -| | » -| | 
3/V5 1/V5 一 1/wW5 —3/V5 
一 1 一 1 
»-| | -| | 
1/V5 —3/V5 3/Y5 一 1/W5 
则 8 阶 的 斯 拉 特 变换 矩阵 可 写 为 (T。 为 2X2 单位 矩阵 ) 
[4 0 A 01B B 0 0 
Sa 0L 0 LL B B 0 0 
| 
LoL, 0 -Ljlo 0 B 有 
Tr 1 1 1 1 1 1 1 
7/ V21 5/ V21 3/ V21 1/ v21 1/ v21 3/ v21 5/ V21 7/ V21 
1 —1 一 1 1 一 1 一 1 Y 
1| JW —3/V5 3/V5 —1/V5 UY5 —3/Y5 3  —1/V5 
| ay/ 由 V5 /V5 3/V5 3/V5 VY YS 3/V5 
7/ V105 —1/ V105 —9/ V105 一 17/ V105 17/ V105 9/ V105 1/ —7/ V105 
1 = 一 下 1 一 出 于 一 六 
| WE =/ 沂 3/V5 —l/Y5 lV 35  —3/V5 1/V5 
4-7 多 种 变换 的 计算 
名 题 面 : 
给 出 一 个 取 4 个 值 的 函数 f(z), 其 中 f(0)==0,f(1)=1,f(2)=1,f(3)=2。 





(1) 计算 该 函数 的 沃 尔 什 变换 。 
(2) 计算 该 函数 的 哈达 玛 变换 。 
(3) 计算 该 函数 的 离散 余弦 变换 。 





殷 解 析 : 
(1) W(0)=1,W(1) 1/2,W(2) 二 一 1/2,W(3)= 二 0, 其 中 : 








3 入 
WO)= FDI Drm 
= 








tf Do Dh C— 1) Vm 十 fC2) (— 1)% 0) 〈 一 1) 二 2 -| 





fC3) (— Dh YY (— Im m0] 


=+[1xX1x1+1xX1X1+2xX1x1]=1 


(2) H(0)=1,H(1) 1/25H(2) 1/2,H(3)=0, 其 中 : 














3 1 
H()= 二 2 fc) (— DEPn 
0 


二 [FT (一 1) 和 DGD+6CD60D 十 f(2) (一 1) 00 +6 C26 0) 十 
4 


£3) (一 1)% D+] 


一 了 DX (一 D+1X1+2X1] 一 一 去 
(3) C(O) 一 2,C(1) 一 22cos(x/8),C(2) 一 22cos(r/4),C(3) 一 一 22sin(x/8) ,其 中 : 


1 六 2(2r+ Dr 
CC2) 一 霹 羔 Fa)eos[ ] 


让 [AoDees( 到] fweos( 罕 | | /seos( 至]] 


Vacos( 至 ) 











4-8 ” 哈 尔 变换 的 基 范 数 


名 题 面 : 
试 画 出 哈 尔 小 波 的 一 组 正 交 归 一 化 基 
函数 。 0 j=0.E=0 











哈 尔 变换 的 基 范 数 全 部 通过 对 一 个 基 
本 小 波 进行 平移 和 伸缩 来 实现 。 基 本 小 波 
以 2 的 乘 方 减 小 尺度 而 逐渐 变 罕 (其 幅度 以 3 
2 的 乘 方 增加 以 保持 正 交 归 一 性 ) ,而 每 一 

个 变 小 的 小 波 以 它 的 宽度 为 增 量 来 平移 ,这 
样 在 任何 尺度 上 一 组 完整 的 小 波 都 可 以 完 5 
全 覆盖 整个 区 间 。 图 解 4-8 给 出 哈 尔 小 波 6 
的 一 组 正 交 归 一 化 基 函 数 。 

















j=2,k=3 


一 一 一 一 一 
气 解析 : 一 一 一 一 j=1,k=0 
sy 
= 
{a 
二 








图 解 4-8 ” 哈 尔 小 波 的 一 组 正 交 归 一 化 基 范 数 


。 30 。 


4-9 了 哈 尔 变换 矩阵 


各 题 面 : 
试 写 出 N= 二 8 阶 的 哈 尔 变 换 矩 阵 。 
气 解 析 : 


对 E00 1 
2, 3,，4, 所 以 哈 尔 和 矩阵 















































| J 1 1 1 | 1 1 
1 | 1 i = = 一 1】 一 1 
好 = 一 灌 0 0 0 0 
六 = 0 0 0 V2 V2 一 人 一 
V8|2 —2 0 0 0 0 0 0 
0 0 2 一 2 0 0 0 
0 0 0 0 2 一 2 0 0 
0 0 0 0 0 0 2 一 2 
4-10 了 哈 尔 函 数 计算 
气 题 面 : 
计算 N=8 时 哈 尔 函 数 的 各 项 。 
气 解析 : 
计算 结果 如 表 解 4-10 所 示 。 
表 解 4-10 ”N=8 时 的 哈 尔 函 数 
k 0 1 2 3 4 5 6 7 
p 0 0 1 i 加 2 2 2 
gq 0 1 1 8 2 3 4 
2 0 1 2 2 4 4 4 4 
(g—1)/2* 一 1 0 0 到 2 0 1/4 2/4 3/4 
(g—1/2)/2* -2 2 1/4 3/4 1/8 3/8 5/8 7/8 
eg 0 1 1/2 1/4 2]4 3/4 1 
证 1 BA Rs 2 2 2 2 
hm (0/8) 1 1 0 2 0 0 0 
hm (1/8) 1 1 2 0 一 2 0 0 0 
hm (2/8) | 1 一 和 0 0 2 0 0 
hm (3/8) 1 一 2 0 0 一 2 0 0 
hm (4/8) 1 = 0 -i 0 0 六 0 
hm (5/8) 1 一 1 0 2 0 0 一 2 0 
hm (6/8) 1 -= 0 六 0 0 0 2 
hm (7/8) 1 一 1 0 一 2242 0 0 一 2 


























4-11 和 矩阵 的 哈 尔 变换 计算 


各 题 面 : 
对 2-D 逢 阵 |， 4 | 计算 其 哈 尔 变换 
名 解析 : 
哈 尔 变 换 是 可 分 离 和 对 称 的 变换 ,所 以 可 利用 矩阵 形式 二 HXH 来 计算 , 即 


rm a 
4-12 ”了 哈 尔 变 换 和 哈达 玛 变换 的 计算 


艺 题 面 ， 
2 4 
久 定 f(z-|。 oh 
(1) 列 式 计算 f(x, y) 的 哈 尔 变换 。 
(2) 将 上 面 得 到 的 哈 尔 变换 结果 看 成 是 对 g(Cz, y) 的 哈达 玛 变 换 结果 , 列 式 计算 gCz，y)。 
要 解析 : 
(1) 用 矩阵 形式 : 


si le wl oi 


(2) g(0,0)={H(0, 0)+H(0, 1)+H(1, 0)+H(1, 1)}/2={12—4—6+2}/2=2 
g(0, 1)={H(0, 0)—H(0, 1)+H(1, 0)—H(, 1)}/2={12+4—6—2}/2=4 
g(l, 0)={H(0, 0)+H(0; 1)—H(l; )—H(l, 1)}/2={12—4+6—2}/2=6 
g(l, 1)={H(0, 0)—H(OO0, 1)—H(Q, 0)+H(1, 1)}/2={12 二 4 二 6+2}/2=12 


4-13 ”了 哈 尔 小 波 函 数 及 其 傅 里 时 变换 


















































名 题 面 : 
用 门 函 数 来 表示 哈 尔 小 波 函 数 ,并 画 出 其 傅 里 叶 变换 。 
解析: 


哈 尔 小 波 可 看 作 由 两 个 门 函数 组 成 (如 图 解 4-13(a) 所 示 ): 


h(D) 一 rect [2(: 1 ]] rect [2 >] 
它 以 二 1/2 为 中 心 ,是 一 个 奇 对 称 实 函 数 , 其 传 里 叶 变换 为 (如 图 4-13(b) 所 示 ) : 


1— cos(xu) 
Tu 





H(wW = 2 
它 的 模 是 正 的 偶 函 数 ,以 wx 王 0 为 对 称 轴 。 
“ Ds 


exp(— jxu) 


Ah(D HW) 


(a) (b) 
图 解 4-13” 哈 尔 小 波 函 数 及 其 健 里 叶 变 换 


4-14 ”时 域 窗 和 频 域 窗 


名 题 面 : 
计算 窗 函 数 g, (1) 二 exp( 一 at?), a 记 0 在 时 域 中 和 频 域 中 窗口 的 宽度 ,并 据 此 验证 不 确 
定性 原理 。 


























如 解析 : 
先 考虑 时 域 , 因 为 g,(?) 是 一 个 偶 函 数 ,所 以 可 知 1" 二 0。 进 一 步 计 算 : 
co 1/2 
A TE 全 | 三 eeoc xueod] 
[sg | 刘 c a | 全 em 2 人 二 
1 co 1/2 到 1 请 1 
A [ga Ca) | 寺 厂 se zu = Te I | "| 20 | = 2 





再 考虑 时 域 , 窗 函数 g。(2) 的 传 里 叶 变 换 为 


i = 
Ga(w) 一 到 exp 人 请 


类 似 对 As 的 分 析 和 计算 ,可 得 到 ww* =0 和 Ac=a4 。 其 中 ,对 Ac 的 计算 可 令 a 一 1/4a 
并 代入 As 的 结果 而 得 到 。 
因为 AsAc=1/2, 所 以 满足 不 确定 性 原理 。 


4-15 盖 伯 变换 滤波 图 像 


各 题 面 : 

选取 实际 图 像 ,计算 不 同 尺 度 和 不 同 朝向 的 盖 伯 变换 滤 
波 图 像 。 

扣 解 析 : 

选取 的 一 幅 128X128 像素 的 实际 图 像 如 图 解 4-15(1) 所 示 。 

计算 共 选 取 了 5 个 尺度 和 6 个 朝向 ,所 以 得 到 30 幅 盖 伯 图解 415(1) 一 幅 实 际 图 像 





变换 滤波 图 像 。 这 30 幅 图 像 如 图 解 4-15(2) 所 示 ,其 中 每 行 对 应 一 个 尺度 (从 粗 到 细 ) ,每 
列 对 应 一 个 朝向 (角度 ) ,分 别 是 0"、30"、60"、90"、120"、150"( 根 据 对 称 性 ,这 也 覆盖 了 180"” 
到 330?) 。 





图 解 4-15(2) 30 幅 盖 伯 变换 滤波 图 像 


昌 图 解 4-15(2) 可 见 , 对 每 一 行 (具有 相同 尺度 ) , 盖 伯 变换 滤波 图 像 中 的 边缘 线条 会 随 
着 朝向 角度 的 变化 而 顺 时 针 旋 转 ; 对 每 一 列 ( 具 有 相同 朝向 角度 ) , 盖 伯 变换 滤波 图 像 中 的 
边缘 线条 会 随 着 尺度 从 粗 到 细 的 变化 而 逐渐 变 细 。 对 应 小 尺度 的 图 像 中 有 更 多 ( 较 暗 的 ) 细 
节 , 而 在 对 应 大 尺度 的 图 像 中 只 能 看 到 比较 模糊 (但 比较 亮 ) 的 粗 结构 。 


4-16 缩放 函数 和 小 波 函 数 

















气 题 面 : 
请 用 属于 U。 的 缩放 函数 和 属于 V。 的 小 波 函 数 来 表达 下 面 的 f(z): 
ls 
f(z) = 4 一 1， 
人 





(1) 画 出 f(x) 的 示意 图 。 

(2) 分 别 画 出 缩放 函数 与 小 波 函 数 的 示意 图 。 

(3) 分 别 给 出 缩放 函数 的 和 与 小 波 函 数 的 和 的 表达 式 。 
.34 。 





可 解析: 
(1) f(z) 的 示意 图 如 图 解 4-16(1) 所 示 。 /09) 
(2) 哈 尔 缩放 函数 和 哈 尔 小 波 函 数 的 示意 图 分 别 如 图 1 
解 4-16(2a) 和 图 解 4-16(2b) 所 示 。 | | 
(3) 哈 尔 缩放 函数 的 和 与 哈 尔 小 波 函 数 的 和 的 表达 式 一 1 一 














1 2 芝 
分 别 为 
记 (z) 一 下 wooCz) 十 uon (x) 一 去 wows(z) -1 
1 1 图 解 4-16(1) 原始 函数 
fal(r) =— vo,o (XT) 二 v0,2 (7) 
加 
GD JoD 
1 
— 3 Te 
起 0 1 2 x 
-1 
(b) 
图 解 4-16(2) ” 哈 尔 缩放 函数 和 哈 尔 小 波 函 数 
4-17 小 波 变换 和 反 变 换 
各 题 面 : 











给 出 一 个 取 4 个 值 的 函数 f(z), 其 中 f(0)=1,f(1)=4,f(2) 3,f(3)=06 
(1) 列 式 计 算 该 函数 的 离散 小 波 变换 的 近似 系数 和 细节 系数 。 

(2) 进一步 列 式 计算 (1) 中 结果 的 离散 小 波 反 变换 , 以 验证 (1) 中 的 结果 。 

所 解析 : 

(1) 先 将 f(x) 的 值 代入 近似 系数 和 细节 系数 的 计算 公式 ,因为 M 二 4, 所 以 可 得 到 


W,(0.k) = A 
= 3[1 0 pe eR PR ep 


1 
W,(j,k)= 碳 2 





= [1 Xv lO) AXva DD) —3Xv(2) +0X vw.(3)] 


这 里 只 取 j==0 和 j 二 1, 对 应 的 分 别 为 k= 二 0 和 k= 二 0, 1。 如 果 取 缩放 函数 wo, (x) 二 
{1 1 ls 1 小 波 函 数 却 (2)= {1 一 1 一 1jywmo (z= ;一 /2 0 0) va,i(z)= 
{1, 1, 1, 1}, 则 有 

近似 系数 : W.(0,0) 一 译 [1X1+4X13X1+0X1]=1 








。 35 。 


细节 系数 : W。(0,0) 一 于 [LIX1+4X1+3X1 一 0X1] 一 4 


3 
3 








1 
机。(1,0) 一 到 [1XV2 一 4XV2 十 3X0 一 0X0] 一 





WCG,D 一 斑 [1X0+T4X0+3XVZ 一 0xyZ] 一 一 写 / 5 
(2) 根据 对 f(x) 的 展开 式 , 利 用 上 面 算得 的 近似 系数 和 细节 系数 ,可 写 出 
f(z) = 去 [1 X uo lz) +4X voo lr) —3X vo(r) +0 X wlr)] 
将 上 面 的 缩放 函数 和 小 波 函 数 代 入 ,得 到 























fo = 1x1+4x1 3 x 次 xo|-: 

AD= 旨 :xai+4xa+ Sy pie 

fC2) $ix1 4xX1+3 妈 xo-3 虹 Eg|-—s 

fo =#|1x1 4X1 sx] 
见 , 函 数 f(z) 得 到 了 复原 。 


4-18 ”小 波 变 换 系数 的 计算 


如题 面 : 

(1) 先 考 虑 两 级 离散 小 波 变换 。 如 果 输 入 信号 为 f(x) 二 0, z=0, 1, 2, 3,f(x)=1， 
Zz 二 4,，5，6,7, 设 最 高 尺度 为 试 计算 W,(J 一 1, k)、W(J 一 1, k)、W,(J 一 2, k)、W,(J 一 
2, &)。 这 时 对 信号 的 表达 有 多 少 个 尺度 ? 

(2) 再 将 两 级 离散 小 波 变换 扩展 到 三 级 离散 小 波 变换 ,如 果 输 入 信号 为 f(z) 王 1，z 一 
0 

如 解析 : 

(1) 借助 多 分 辩 率 细 化 方程 ,可 得 


jk) = = w= 
Os 其 他 
1l1/V2; k=0 

co 上 下 三 起 
0， 其 他 


由 原始 函数 W,(J，&) 二 了 (Ck) , 则 
WJ —1,k) = Phon—28W.(J,n) 一 0 


V2， k=2,3 


WJ —1,k) = Phtn— 2 Wn) = 
= 0， 其 他 


。36 。 











WJ —2,k) = Ph,n—2 WT —1,n=0 
2, k=1 


0， 其 他 
因为 尺度 参数 可 取 J、J 一 1、J 一 2, 所 以 对 尺度 的 表达 共有 3 个 尺度 。 
(2) 由 第 一 级 变换 可 得 











WJ —2,8) = Ph,ln—2RW,] — 1,n) | 


2 WO 


WJ —1,k) = Dh,n— 2 Wn) = | 
= 0， ”其 他 


由 第 二 级 变换 可 得 
2,， k=0,1 


0， 其 他 











W, (J —2,k) = Ph,ln— 2 WJ — 1,n) | 
由 第 三 级 变换 可 得 
WJ —3k) = Phtn—2R WT —2,n) = Dh,n—2RW(] —2,n) 
最 后 得 到 











2Y2; k=0 


0， 其 他 
W,(J—3,k) =0, k=0,1,2,3,4,5,6,7 


4-19 ” 拉 东 变换 的 计算 


W.(J —3;,k) = 


如 题 面 : 
计算 f(zx,y) 二 exp{ 一 (zx/a)? 一 (y/0)?} 的 拉 东 变换 。 
解析 : 


家 jCB3 扩 = 外 f(x,y) dl = 入 让 expl (2/) — /py 


Lt li 


sin20 sing 


EE 部 J _、 后 | 
senhap exp[ sin20 ]4 


要 p’ J Es 
don (sh _exp[ sg |)]e 


一 exp( 一 p)| exp[— wiJdu = Vrexp(— p’) 




















4-20” 霍 特 林 反 变换 


部 题 面 : 
霍 特 林 变 换 的 定义 式 为 y 二 A(x 一 m.) ,其 中 A 是 将 x 转换 为 ?的 变换 矩阵 ,mx 是 x 矢 
家 加 


量 的 均值 。 霍 特 林 变 换 可 将 x 映射 到 y。 如 果 只 知道 y 的 信息 ,而 不 知道 原始 x 的 任何 信 
息 , 能 否 进行 霍 特 林 反 变换 由 了 求 得 x? 为 什么 ? 

气 解析 : 

由 霍 特 林 变 换 定 义 式 可 得 x 一 47y 十 me。 可 见 为 从 了 求 得 x 必须 要 知道 x 的 统计 信 
息 ,包括 均值 矢量 ms 和 协 方差 矩阵 C.( 由 C, 计算 A 需要 知道 C.)。 所 以 ,如 果 不 知 道 原始 
x 的 必要 信息 ,并 不 能 由 y 求 得 x。 事 实 上 , 霍 特 林 反 变换 是 不 存在 的 。 


4-21 霍 特 林 变 换 的 证 明 





名 题 面 : 

霍 特 林 变 换 的 定义 式 为 y 二 A(x 一 m,) ,其 中 4 是 将 x 转换 为 ?的 变换 矩阵 ,mx 是 x 矢 
量 的 均值 。 证 明 : 

(1) 由 这 个 变换 得 到 的 y 矢量 的 均值 m, 是 零 。 

(2) y 矢量 的 协 方差 矩阵 C, 可 由 A 和 x 矢量 的 协 方差 矩阵 C。 得 到 。 

(3) C, 是 一 个 对 角 和 矩阵 , 它 的 主 对 角 线 上 的 元 素 正 是 C. 的 特征 值 。 

气 解 析 : 

(1) my,=E{y}=E{A(x—m:)}=E{Ax}—E{Am:}=Am:—Am:=0 

(2) C, =E({(y—m,) (y—m,)™)} 

E{A(x—m:)(x—m.)™ AT}=AE{(x—m,)(x—m.)'}AT=AC,.AT 

(3) 因为 4 是 由 Cu 的 特征 矢量 组 成 其 各 行 的 矩阵 ,所 以 AC.A" 为 对 角 和 矩阵 ,由 (2),C, 

是 一 个 对 角 和 矩阵 。 进 一 步 ,4C.47 主 对 角 线 上 的 元 素 是 C 的 特征 值 ,所 以 C, 的 形式 为 












































0 AN 
它 的 主 对 角 线 以 外 的 元 素 均 为 零 , 即 y 矢量 的 各 元 素 是 不 相关 的 。 考 虑 到 4; 也 是 C 的 特 
征 值 , 并 且 沿 对 角 和 矩阵 的 主 对 角 线 上 的 元 素 是 它 的 特征 值 , 所 以 C. 和 C, 具有 相同 的 特征 值 
和 相同 的 特征 矢量 。 


4-22 霍 特 林 变 换 的 计算 


各 题 面 : 

设 有 一 组 随机 矢量 x==[xi xz x3]" ,其 中 x 二 [0 0 1]T zs 一 [0 10]7,xs 一 [100] ,请 
分 别 给 出 x 的 协 方差 矩阵 和 经 霍 特 林 变 换 所 得 到 的 矢量 y 的 协 方差 矩阵 。 

名 解析 : 

均值 矢量 为 


i #[1 1 
x 的 协 方差 矩阵 为 
. 38 . 


C: 的 特征 矩阵 为 




















—1 一 1 2 一 
所 以 特征 多 项 式 为 
2 一 % —1 一 1 
1 2—% 人 一 和 一 802 一 办 一 2 
一 下 一 1 Bo—A 
特征 值 所 满足 的 特征 方程 为 


(2 一 人 7 一 3(2 一 ) 一 2 一 0 
解 上 述 一 元 三 次 方程 ,得 到 3 个 特征 值 : 

N=0,， hs=3, hs=3 
经 霍 特 林 变换 所 得 到 的 矢量 ”的 协 方差 矩阵 的 对 角 元 素 就 是 Cx 的 特征 值 ,所 以 
让 
人 
0 0 0 


4-23 用 霍 特 林 变 换 重 建 的 均 方 误差 


G= 








如 题 面 : 

设 有 一 组 64X64 像素 的 图 像 ,如 果 它 们 的 协 方差 矩阵 是 单位 矩阵 ,那么 当 仅 使 用 一 半 
的 原始 特征 值 利 用 霍 特 林 变 换 计算 重建 图 像 时 ,原始 图 和 重建 图 之 间 的 均 方 误差 是 多 少 ? 

如 解析 : 

对 64X64 像素 的 图 像 , 其 协 方差 矩阵 是 (64X64)X(64X64) 的 矩阵 ,所 以 均 方 误 差 


64X64 32X64 64X64 4096 


i = 2 贡生 罗 站 = 的 酌 
j=1 j=1 


j=32X64+1 j=2049 
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本 单元 包括 4 章 : 
第 5 章 图 像 增强 
第 6 章 图 像 恢 复 
第 7 章 图 像 编 码 
第 8 章 拓展 技术 


覆盖 范围 /内 容 简介 

图 像 处 理 对 应 图 像 工程 的 第 一 层次 。 作 为 图 像 工程 的 最 低层 次 ,图 像 处 理 的 抽象 性 比 
较 能 ,语义 层次 也 处 在 低层 , 它 主 要 在 图 像 的 像素 级 别 上 进行 操作 ,处 理 的 数据 量 比 图 像 分 
析 和 图 像 理 解 都 大 。 虽 然 近年 来 又 有 许多 新 的 图 像 处 理 技 术 得 到 了 研究 和 应 用 , 原 有 的 图 
像 处 理 技 术 又 有 了 许多 更 新 和 扩展 ,但 上 述 几 个 特性 仍然 得 到 了 保留 。 

可 将 图 像 处 理 看 作 一 大 类 图 像 技术 的 代表 , 它 着 重 强调 在 图 像 之 间 进 行 的 操作 转换 ( 操 
作 的 输入 和 输出 都 是 图 像 )。 虽 然 人 们 常用 图 像 处 理 泛 指名 种 图 像 技术 ,但 比较 狭义 的 图 像 
处 理 技术 的 主要 目标 是 要 对 图 像 进行 各 种 加 工 以 改善 图 像 的 视觉 效果 并 为 其 后 的 目标 分 析 
和 场景 解释 打 基 础 ,或 对 图 像 进行 压缩 编码 以 减少 图 像 存储 所 需 的 空间 或 图 像 传输 所 需 的 
时 间 ( 从 而 也 降低 了 对 传输 通路 的 带宽 要 求 )。 图 像 处 理 是 图 像 分 析 和 图 像 理 解 的 基础 ,也 
常常 作为 它们 的 预 处 理 手段 。 本 单元 主要 围绕 狭义 的 图 像 处 理 进 行 讨 论 。 

图 像 处 理 的 主要 技术 基本 上 可 分 成 3 大 类 : 图 像 增强 、 图 像 恢复 、 图 像 编 码 。 在 这 些 基 
本 技术 的 基础 上 ,可 向 许多 方向 进行 推广 。 例 如 ,将 一 些 特定 信息 嵌入 图 像 或 从 图 像 中 提取 
出 来 就 能 实现 图 像 水 印 、 信 息 隐藏 、 图 像 认证 ; 将 图 像 属 性 从 灰 度 推 广 到 彩色 ,就 是 彩色 图 
像 处 理 ; 将 图 像 坐标 从 空间 推广 到 时 间 , 就 是 视频 图 像 处 理 ; 将 对 图 像 的 表达 从 单个 分 辩 














率 扩展 到 多 个 分 辩 率 ,就 可 进行 多 尺度 图 像 处 理 。 
参考 书目 /配合 教材 
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图 像 增强 技术 是 最 基本 和 最 常用 的 一 大 类 图 像 处 理 技术 ,也 常常 作为 使 用 其 他 图 像 技 
术 之 前 的 预 处 理 手段 。 图 像 增强 的 目的 是 通过 对 图 像 的 特定 加 工 , 将 被 处 理 的 图 像 转 化 为 
对 具体 应 用 来 说 视觉 质量 和 效果 更 “好 ”或 更 “有 用 ”的 图 像 。 由 于 各 个 具体 应 用 的 目的 和 要 
求 不 同 ,因此 这 里 “好 ”和 “有 用 ”的 含义 也 不 完全 相同 。 从 根本 上 说 ,并 没有 图 像 增 强 的 通用 
标准 。 对 每 种 图 像 处 理应 用 ,观察 者 都 是 增强 技术 优 劣 的 最 终 判 断 者 。 图 像 增强 技术 常常 
考虑 和 借助 人 类 视觉 系统 的 特性 以 取得 看 起 来 较 好 的 视觉 结果 。 由 于 视觉 观察 和 评价 是 相 
当主 观 的 过 程 , 所 以 * 好 图 像 ” 的 定义 并 不 是 固定 的 , 常 因 人 而 异 。 

随 着 图 像 获取 设备 日 新 月 异地 发 展 , 人 们 所 采集 到 的 图 像 的 种 类 逐渐 增加 ,它们 代表 的 
场景 不 同 、 获 取 的 方式 不 同 , 其 视觉 质量 也 不 相同 ,所 以 对 它们 的 增强 要 依据 不 同 的 原理 进 
行 。 多 年 来 人 们 已 研究 出 许多 图 像 增 强 技术 ,对 这 些 技术 有 不 同 的 分 类 标准 和 方法 。 

目前 常用 的 图 像 增强 技术 根据 其 处 理 所 进行 的 空间 不 同 , 可 分 为 基于 空域 (图 像 域 ) 的 
方法 和 基于 变换 域 的 方法 两 类 。 其 中 基于 空域 的 方法 有 很 多 ,根据 增强 运算 的 特点 ,还 可 以 
分 为 基于 点 操作 和 基于 模板 操作 的 两 组 。 在 基于 点 操作 的 空域 增强 方法 中 ,基于 图 像 坐标 
变换 的 方法 、 利 用 图 像 之 间 ( 算 术 和 人 逻辑 ) 运 算 的 方法 、 借 助 图 像 灰 度 (分 布 ) 映 射 的 方法 和 利 
用 统计 直方 图 变换 的 方法 都 是 基本 的 。 在 基于 模板 操作 的 空域 增强 方法 中 ,以 一 个 像素 及 
其 相 邻 像素 为 基本 单元 进行 操作 ,可 以 利用 模板 实现 各 种 线性 滤波 和 非 线性 滤波 。 在 基于 
变换 域 增强 技术 中 ,利用 传 里 叶 变 换 得 到 的 频率 域 最 为 典型 。 在 频率 域 中 ,可 以 方便 地 对 图 
像 进行 低 通 ,高 通 、 带 通 、 带 阻 和 同 态 滤波 以 实现 图 像 增强 的 目的 。 

本 章 的 问题 涉及 上 述 图 像 增强 多 个 方面 的 概念 。 


5-1 图 像 增强 方法 辨析 














名 题 面 : 

判断 下 面 各 个 有 关 图 像 增强 的 说 法 正确 与 否 ,并 说 明 原 因 : 

(1) 基于 频 域 的 图 像 增强 方法 可 以 获得 和 基于 空域 的 图 像 增强 方法 同样 的 图 像 增 强 
效果 。 

(2) 基于 像素 的 图 像 增 强 方法 是 一 种 对 图 像 灰 度 的 线性 变换 方法 。 

(3) 基于 像素 的 图 像 增强 方法 是 基于 像素 邻 域 的 图 像 增 强 方法 的 一 种 。 

各 解析 : 

(1) 一 般 正 确 。 因 为 对 图 像 的 增强 既 可 以 在 频 域 进行 也 可 以 在 空域 进行 ,借助 傅 里 叶 
变换 可 以 建立 它们 的 关系 ,所 以 理论 上 说 在 频 域 和 在 空域 进行 的 增强 可 以 有 同样 的 效果 。 


不 过 ,以 上 分 析 仅 对 空域 的 线性 增强 原则 上 正确 ,因为 要 对 空域 的 非 线性 增强 都 在 频 域 找到 
对 应 的 操作 常常 很 困难 ,例如 直方 图 均衡 在 频 域 中 就 很 难 实现 。 
(2) 不 正确 。 对 图 像 灰 度 的 线性 变换 可 以 用 于 图 像 增强 ,但 基于 像素 的 图 像 增强 也 可 
以 通过 对 图 像 灰 度 进行 非 线性 变换 来 实现 ,并 不 能 说 基于 像素 的 方法 一 定 是 线性 的 方法 。 
(3) 从 理论 上 讲 是 正确 的 。 因 为 像素 邻 域 指 一 组 相 邻 的 像素 ,单个 像素 可 以 看 作 是 一 
组 像素 的 特例 。 但 在 实际 应 用 中 ,“ 基 于 像素 ”一 般 用 来 指 基 于 单个 像素 ,与 “基于 像素 邻 域 ” 
(包含 多 个 像素 ) 是 有 区 别 的 。 








5-2 位 面 提取 函数 


要 题 面 : 

用 位 面 提取 函数 T(r)==0, rE[0, 127]; T(r) 二 255, ~ E[128, 255] 能 从 1 幅 有 8 个 
位 面 的 图 像 中 提取 出 其 第 7 个 位 面 。 提 取 该 图 像 的 其 他 各 个 位 面 需 要 使 用 什么 函数 ? 

名 解析 : 

如 果 图 像 有 8 个 位 面 , 则 提取 图 像 第 个 位 面 的 通 式 为 
0， int[Lr/2"] 为 偶数 或 零 


T,(r) = 
(oe. int[Lr/2"] 为 奇数 

以 第 6 个 位 面 为 例 , 有 

0， int[Lr/64] 为 偶数 或 零 

255， int[r/64] 为 奇数 

等 价 于 





[0a rE[0,63] 或 ~E [128, 191] 
mo-| 
255， rEL64,127] 或 rE€ [192, 255] 


5-3 ” 灰 度 映射 曲线 的 分 析 


所 题 面 : 

给 定 如 图 题 5-3(Ca) 所 示 的 两 条 灰 度 映射 曲线 BE (>) 和 E,(s)。 

(1) 讨论 这 两 条 曲线 的 特点 、 功 能 及 适合 应 用 的 场合 。 

(2) 设 工 ==8,E1(s) 二 int[(7s)'? 十 0.5], 对 图 题 5-3(b) 中 直方 图 所 对 应 的 图 像 进行 灰 
度 映 射 , 给 出 映射 后 图 像 的 直方 图 (可 画图 或 列表 , 标 出 数值 ) 。 

(3) 设 工 一 8, ECs) 二 int[s*/7 十 0.5j], 对 图 题 5-3(b) 中 直方 图 所 对 应 的 图 像 进行 灰 度 
映射 ,给 出 映射 后 图 像 的 直方 图 (可 画图 或 列表 , 标 出 数值 ) 。 

忌 解 析 : 

(1) 下 面 分 别 进行 讨论 。 

Ei(s): 在 t 一 * 直 线 的 上 方 ,能 较 大 地 提高 原 图 中 灰 度 较 小 像素 的 灰 度 (及 这 些 像素 之 
间 的 灰 度 差 ) ,但 会 减少 原 图 中 灰 度 较 大 像素 的 灰 度 (及 这 些 像素 之 间 的 灰 度 差 ) ,所 以 可 用 
来 减少 或 压缩 原 图 的 动态 范围 以 及 原 图 明亮 部 分 的 反差 ,适合 应 用 于 原 图 动态 范围 过 大 或 

。 44 。 








Z1 


图 题 5-3 灰 度 映射 曲线 和 实验 直方 图 


原 图 (背景 ) 偏 暗 的 场合 。 





E:(s): 在 1 二 s 直线 的 下 方 ,能 较 大 地 提高 原 图 中 灰 度 较 大 像素 的 灰 度 (及 这 些 像素 之 
间 的 灰 度 差 ) ,但 会 减少 原 图 中 灰 度 较 小 像素 的 灰 度 (及 这 些 像 素 之 间 的 灰 度 差 ), 所 以 可 用 


来 增加 原 图 的 灰 度 对 比 度 以 及 原 图 明亮 部 分 的 反差 ,适合 应 用 于 原 图 动态 范 目 


(背景 ) 偏 亮 的 场合 。 
(2) 计算 结果 如 表 解 5-3(1) 所 示 。 





表 解 5-3(1) 用 E,(s) 映 射 得 到 的 结果 


四 过 小 或 原 图 













































































s 0 1 4 5 6 1 
(75)2 0 2.6458 | 3.7417 | 4.5826 | 5.2915 | 5.9161 | 6.4807 
E(s) 0 3 4 5 5 6 6 7 
Plm) 0.19 0.25 0.21 0. 24 0. 09 0.02 

(3) 计算 结果 如 表 解 5-3(2) 所 示 。 

表 解 5-3(2) 用 E,(s) 映 射 得 到 的 结果 

5 0 1 2 3 4 5 6 加 
s:/7 0 0.1429 | 0.5714 | 1.2857 | 2.2857 | 3.5714 | 5.1428 区 
E,(s) 0 0 1 1 2 4 5 区 
Plm) 0. 44 0.37 0.08 0.06 0.03 0.02 

5-4 调整 灰 度 映射 曲线 的 效果 

如 题 面 : 

给 定 如 图 题 5-4 所 示 的 门 形 灰 度 映射 曲线 EE(s)。 

(1) 用 它 对 图 像 灰 度 进行 映射 ,映射 后 的 图 像 相 比 原 图 Pe 

像 有 什么 特点 ? 入 === 0 

(2) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 s, 的 垂直 线段 

左 移 一 个 单位 ,将 在 sz 的 垂直 线段 右 移 一 个 单位 ,用 新 映射 

函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什么 0 一 2 

特点 ? 1 了 

图 题 5-4 “ 门 形 灰 度 映 射 函 数 
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(3) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 * 的 垂直 线段 右 移 一 个 单位 ,将 在 s; 的 垂直 
线段 左 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什么 
特点 ? 

(4) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 % 的 垂直 线段 左 移 一 个 单位 ,将 在 ss 的 垂直 
线段 也 左 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什么 
特点 ? 

(5) 保持 折线 E(s) 的 基本 形状 不 变 ,将 在 % 的 垂直 线段 右 移 一 个 单位 ,将 在 * 的 垂直 
线段 也 右 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什么 
特点 ? 

(6) 保持 折线 E(s) 的 基本 形状 不 变 ,将 在 的 两 段 水 平 线段 上 移 一 个 单位 ,将 在 ts 的 
水 平 线段 下 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什 
么 特点 ? 

(7) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 的 两 段 水 平 线段 下 移 一 个 单位 ,将 在 ts 的 
水 平 线段 上 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 什 
么 特点 ? 

(8) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 的 两 段 水 平 线段 上 移 一 个 单位 ,将 在 ts 的 
水 平 线段 也 上 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 
什么 特点 ? 

(9) 保持 折线 E(s) 的 基本 形状 不 变 , 将 在 的 两 段 水 平 线段 下 移 一 个 单位 ,将 在 ts 的 
水 平 线段 也 下 移 一 个 单位 ,用 新 映射 函数 增强 的 图 像 与 用 原始 映射 函数 增强 的 图 像 相 比 有 
什么 特点 ? 

如 解析 : 

(1) 映射 后 的 图 像 中 对 应 原始 图 像 中 灰 度 级 位 于 中 间 的 那些 像素 会 变 得 较 亮 ,而 对 应 
原始 图 像 中 灰 度 级 位 于 两 端 ( 偏 黑 和 偏 白 ) 的 那些 像素 会 具有 较 暗 的 相同 亮度 。 

(2) 如 此 移动 以 后 门将 变 宽 。 由 于 有 更 多 的 原来 低 灰 度 像素 的 灰 度 变 高 ,所 以 这 样 增 
强 后 的 图 像 与 用 原始 映射 函数 得 到 的 增强 图 像 相 比 全 局 亮度 更 高 ,图 像 显 得 较 亮 。 

(3) 如 此 移动 以 后 门将 变 窗 。 由 于 有 更 多 的 原来 高 灰 度 像素 的 灰 度 变 低 , 所 以 这 样 增 
强 后 的 图 像 与 用 原始 映射 函数 得 到 的 增强 图 像 相 比 全 局 亮度 更 低 ,图像 显得 较 暗 。 

(4) 如 此 移动 以 后 门 的 宽度 不 变 , 但 门 的 位 置 更 偏 左 。 相 比 用 原始 映射 函数 增强 的 图 像 ,部 
分 较 低 灰 度 像素 的 灰 度 变 高 ,部 分 较 高 灰 度 像素 的 灰 度 变 低 ,但 图 像 的 整体 亮度 值 没 有 变化 。 

(5) 如 此 移动 以 后 门 的 宽度 不 变 , 但 门 的 位 置 更 偏 右 。 相 比 用 原始 映射 函数 增强 的 图 
像 , 部 分 较 低 灰 度 像素 的 灰 度 变 低 , 部 分 较 高 灰 度 像素 的 灰 度 变 高 ,但 图 像 的 整体 亮度 值 没 
有 变化 。 

(6) 如 此 移动 以 后 门 的 宽度 不 变 ,但 门 的 高 度 减 少 。 相 比 用 原始 映射 函数 增强 的 图 像 ， 
灰 度 级 位 于 中 间 的 那些 像素 会 更 瞳 一 些 , 灰 度 级 位 于 两 端 ( 偏 黑 和 偏 白 ) 的 那些 像素 会 更 亮 
一 些 , 图 像 的 整体 对 比 度 会 减 小 。 

(7) 如 此 移动 以 后 门 的 宽度 不 变 , 但 门 的 高 度 增 加 。 相 比 用 原始 映射 函数 增强 的 图 像 ， 
灰 度 级 位 于 中 间 的 那些 像素 会 更 亮 一 些 , 灰 度 级 位 于 两 端 ( 偏 黑 和 偏 白 ) 的 那些 像素 会 更 暗 
一 些 , 图 像 的 整体 对 比 度 会 增加 。 

»。46 。 








(8) 如 此 移动 以 后 门 的 宽度 和 高 度 都 不 变 , 但 整体 提升 了 一 个 单位 。 相 比 用 
函数 增强 的 图 像 , 灰 度 级 位 于 中 间 的 那些 像素 会 更 亮 一 些 , 灰 度 级 位 了 
那些 像素 也 会 更 亮 一 些 , 图 像 整体 要 更 亮 一 些 , 但 相对 对 比 度 不 变 。 








(9) 如 此 移动 以 后 门 的 宽度 和 高 度 都 不 变 , 但 整体 下 降 了 一 个 单位 。 相 比 用 














S-S 


名 题 面 : 


原 


始 映 射 


F 两 端 ( 偏 黑 和 偏 白 ) 的 








原 


始 映 射 
函数 增强 的 图 像 , 灰 度 级 位 于 中 间 的 那些 像素 会 更 暗 一 些 , 灰 度 级 位 于 两 端 ( 偏 黑 和 偏 白 ) 的 
那些 像素 也 会 更 暗 一 些 , 图 像 整 体 要 更 暗 一 些 ,但 相对 对 比 度 不 变 。 


直方 图 均衡 化 的 变型 


一 般 直 方 图 均衡 化 中 所 采用 的 取 整 扩展 函数 是 线性 的 ,可 获得 接近 均匀 分 布 的 结果 。 


现在 考虑 直方 图 {0. 19,0. 25 ,0. 21,0. 16,0. 08,0.06 ,0.03,0.02)}。 
(1) 如 果 采 用 允 近 指数 分 布 的 取 整 扩展 函数 二 int[(L 一 1)lg(1 十 9 )+4 
出 直方 图 均衡 化 的 过 程 和 结果 。 





-0. 5] ,列表 给 


(2) 如 果 采 用 逼近 对 数 分 布 的 取 整 扩展 函数 六 一 int[(L 一 1)exp(m 一 1) 十 0.5], 列 表 给 


出 直方 图 均衡 化 的 过 程 和 结果 。 


名 解析 : 


(1) 指数 分 布 直方 图 均衡 化 的 过 程 和 结果 如 表 解 5-5(1) 所 示 。 
表 解 5-5(1) ”指数 分 布 直方 图 均衡 化 计算 列表 




























































































序号 运 算 步骤 和 结果 
原始 图 像 灰 度 级 0 本 2 3 4 5 6 
原始 直方 图 w% 0.19 | 0.25 | 0.21 | 0.16 | 0.08 | 0.06 | 0.03 | 0.02 
累积 直方 图 如 0.19 | 0.44 | 0.65 | 0.81 | 0.89 | 0.95 | 0.98 | 1.00 
取 整 扩展 : t= 二 int[(L 一 1)lg 本 6 
(1 十 9&) 十 0.5] 
确定 映射 对 应 关系 (5->t) 0-x8 | Te CE a 4，5，6 7 一 7 
闫 捐 隐 对 关 条 本 的 而 化 二 0. 19 0:25 | 0.37 | 019 
方 图 
(2) 对 数 分 布 直方 图 均衡 化 的 过 程 和 结果 如 表 解 5-5(2) 所 示 。 
表 解 5-5(2) 对 数 分 布 直方 图 均衡 化 计算 列表 
序号 运 算 步骤 和 结果 
原始 图 像 灰 度 级 大 0 站 2 3 4 5 6 六 
原始 直方 图 wx 0.19 | 0.25 | 0.21 | 0.16 | 0.08 | 0.06 | 0.03 | 0.02 
累积 直方 图 0.19 | 0.44 | 0.65 | 0.81 | 0.89 | 0.95 | 0.98 | 1.00 
取 整 扩展 : t= 二 int[(L 一 1)lg 6 
(1 十 9 如 ) 十 0. 5] 
确定 映射 对 应 关系 (st ) 0 一 3 | 1 一 4 | 2 一 5 3, 4,—6 5, 6, 7—7 
2 0.19 | 0.25 | 0.21 | 0.24 | 0.11 





5-6 用 1-D 模板 实现 2-D 模板 的 卷 积 


名 题 面 : 
以 索 贝尔 模板 为 例 ,证 明 采 用 2-D 模板 进行 卷 积 的 效果 可 用 1-D 模板 实现 。 
如 解析 : 
以 水 平方 向 的 索 贝尔 模板 为 例 (垂直 方向 的 类 似 )。 将 模板 分 解 如 下 : 
= Dr | 
= 人 /全 


| 二 多 林 
i 地 











| 
可 见 , 先 用 1-D 差分 模板 [一 1 0 1] 对 图 像 进 行 卷 积 ,再 用 1-D 差分 模板 L1 2 1] 对 图 像 进行 
卷 积 ,其 效果 等 同 于 直接 用 原 2-D 模板 进行 卷 积 。 


5-7 小 尺寸 模板 与 大 尺寸 模板 


气 题 面 : 

试 分 析 在 模板 卷 积 中 ,为 什么 将 小 尺寸 的 模板 反复 使 用 ,也 可 得 到 加 权 大 尺寸 模板 的 
效果 。 

如 解析 : 

设 原始 图 像 为 了 ,小 模板 为 h, 则 第 一 次 使 用 与 f 进行 卷 积 得 到 的 结果 为 g 二 1@f。 
设 青 次 使 用 hh 与 g 进行 卷 积 得 到 的 结果 为 g?, 则 g* = 二 i@g= 二 [hf]=[h@hn]@f= 
hf。 这 里 如 代表 小 模板 与 小 模板 卷 积 得 到 的 结果 ,实际 上 对 应 一 个 加 权 大 尺寸 模板 ,如 
图 解 5-7 所 示 。 














图 解 5-7 ”小 模板 卷 积 得 到 大 尺寸 模板 


5-8 用 不 同 平均 来 消除 噪声 


名 题 面 : 
将 M 幅 图 像 借助 图 像 加 法 相 加 后 再 求 平均 值 ( 加 法 平均 ) 可 以 获得 消除 噪声 的 效果 ,用 一 个 
nXn 的 模板 进行 邻 域 平均 也 可 以 获得 消除 噪声 的 效果 , 试 讨论 和 比较 这 两 种 方法 的 消 品 效 果 。 
气 解析 
噪声 消除 的 效果 既 与 消 噪 方式 有 关 ,也 与 参与 平均 消 噪 的 像素 数量 有 关 。 
。48 。 


先 考 虑 消 噪 方式 。 设 原始 图 像 为 f(x，y) ,到 加 噪声 后 的 图 像 为 g(x, y) 二 f(x, y) 十 
e(z，y)。 这 里 设 噪声 在 不 同 幅 图 像 中 独立 同 分 布 , 零 均值 ,方差 为 SCz，>y)。 如 果 使 用 M 
幅 图 像 的 加 法 平均 ,得 到 





M M M 
A(z,y) = Ma) 一 Mf) 十 ei(Czyy) = f(x,y) tM) 


可 见 ,平均 后 的 结果 为 原始 图 像 上 释 加 幅度 为 原来 1/M 的 噪声 (噪声 方差 为 原来 的 1/ VM)。 
可 以 说 ,这 样 的 平均 后 基本 保留 了 原始 图 像 ,所 释 加 的 噪声 幅度 在 整 幅 图 像 各 处 都 减少 了 。 

如 果 使 用 nXn 的 模板 进行 邻 域 平均 , 则 等 价 于 对 图 像 进 行 低 通 滤波 ,所 以 原始 图 像 会 
发 生变 化 。 这 样 的 平均 在 滤 去 高 频 噪声 的 同时 也 滤 去 了 一 些 图 像 中 的 高 频 信息 ,会 使 图 像 
的 对 比 度 下 降 , 细 节 变 得 模糊 。 事 实 上 ,这 样 的 平均 相当 于 把 噪声 在 邻 域 范围 内 进行 了 平 
均 ,原来 噪声 大 的 像素 上 的 噪声 会 减少 ,但 原来 噪声 小 或 没有 噪声 的 像素 上 的 噪声 有 可 能 增 
加 。 另 外 ,低频 噪声 也 不 易 被 滤 去 。 

再 考虑 参与 平均 消 噪 的 像素 数量 。 将 M 幅 图 像 进行 加 法 平均 利用 了 M 幅 图 像 中 同一 个 
位 置 的 M 个 像素 的 平均 值 ,用 一 个 xn 的 模板 进行 邻 域 平均 利用 了 同一 幅 图 像 中 的 nXn 个 
像素 的 平均 值 。 一 般 参 与 的 像素 个 数 越 多 ,消除 噪声 的 能 力 越 强 ,所 以 如 果 MnXn, 则 前 者 
消除 噪声 的 效果 较 好 ,反之 后 者 消除 噪声 的 效果 较 好 (这 里 没有 考虑 方式 不 同 带 来 的 影响 )。 


5-9 ”增强 图 像 中 特定 统计 特性 的 区 域 





如题 面 : 
可 以 根据 下 式 对 图 像 f(x，y) 中 灰 度 比较 小 且 方 差 也 比较 小 的 区 域 进 行 增强 ,提高 灰 
度 对 比 度 : 
Er(z,y)，Mw <aM;, AND 6S; < Sw eS, 


f(z,y)， 其 他 

其 中 ,a、b\c\E 均 为 系数 (一 般 a 二 0.5,6 二 c 过 0.5,2 二 E 二 5); Mw 和 Sw 分 别 是 以 (z，y) 为 
中 心 的 图 像 窗 口 W( 常 可 取 3X3) 中 的 灰 度 均值 和 灰 度 方差 ; Mr 和 Sj 分 别 是 图 像 f(x,y) 
的 灰 度 均 值 和 灰 度 方差 。 

(1) 分 析 上 述 图 像 增 强 方法 的 原理 ,为 什么 两 个 不 等 式 可 帮助 选择 期 望 的 区 域 ? 

(2) 如 果 需 要 增强 图 像 中 灰 度 比较 大 但 方差 比较 小 的 区 域 ,应 如 何 调整 上 式 ? 各 系数 
如 何 选择 ? 

所 解析 : 

(1) 选择 的 3X3 窗口 相对 于 全 图 比较 小 ,可 以 刻画 局 部 的 特征 ,而 且 比 较 准 确 地 描述 
局 部 的 均值 和 方差 。 在 题 面 公 式 的 条 件 中 ,逻辑 运算 前 的 第 一 个 不 等 式 帮 助 选择 灰 度 值 低 
于 全 图 平均 值 的 所 有 图 像 区 域 , 逻 辑 运算 后 的 第 二 个 不 等 式 帮助 选择 灰 度 值 的 方差 低 于 全 
图 平均 值 的 区 域 。 增 强 时 用 的 乘法 操作 会 使 该 区 域内 像素 灰 度 的 方差 增加 ,从 而 可 增 大 对 
比 度 ,达到 增强 目的 。 

(2) 这 里 需要 选择 灰 度 值 高 于 全 图 平均 值 ,但 灰 度 值 的 方差 仍然 低 于 全 图 平均 值 的 图 
像 区 域 。 为 此 ,可 改 逻 辑 运 算 前 的 第 一 个 不 等 式 为 Mw 宇 aMy, 且 取 a 记 2, 其 他 系数 仍 可 类 
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g(X'y) 一 


似 (1) 中 选取 。 


5-10 借助 像素 梯度 进行 增强 


名 题 面 : 
可 以 借助 像素 的 梯度 来 进行 图 像 增强 。 一 种 方法 是 先 对 原始 图 像 f(x，y) 进 行 3X3 
邻 域 平均 , 青 用 下 式 进 行 增强 : 


GLfCz,y], GLflz,y)]>T 
h(xz,y) = 


f(zsy)s 其 他 
其 中 ,GL[f(z, y)j 是 f(z, y) 在 (zx, yy) 处 的 梯度 ( 灰 度 差 ); 工 是 非 负 的 阔 值 。 

(1) 增强 图 像 中 哪些 地 方 会 得 到 增强 ? 

(2) 如 果 改 变 阔 值 T 的 数值 ,对 增强 效果 有 哪些 影响 ? 

各 解析 : 

(1) 这 里 给 出 一 组 实验 图 像 ,如 图 解 5-10(1) 所 示 , 其 中 图 解 5-10(1a) 、 图 解 5-10(1b)、 
图 解 5-10(1c) 分 别 为 原始 图 像 、 邻 域 平 均 图 像 .增强 图 像 ( 浆 值 T 王 150) 。 可 见 邻 域 平 均 使 
图 像 比较 柔和 ,而 利用 增强 式 可 使 图 中 灰 度 变化 比较 剧烈 的 部 分 (如 各 种 边缘 和 轮廓 ) 被 突 
出 了 出 来 ,但 对 灰 度 变化 缓慢 的 部 分 没有 太 多 影响 。 





图 解 5-10(1) 增强 的 效果 


(2) 这 里 也 给 出 一 组 实验 图 像 , 如 图 解 5-10 (2) 所 示 , 其 中 图 解 5-10 (2a)、 
图 解 5-10(2b) 、 图 解 5-10(2c) .图解 5-10(2d) 分 别 对 应 国 值 T 一 200、T 王 150、T 一 100 了 一 50 











图 解 5-10(2) 阔 值 对 增强 效果 的 影响 
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的 增强 结果 。 可 见 原始 图 像 中 灰 度 变 化 剧烈 的 区 域 得 到 了 加 强 , 且 加 强 的 范围 和 程度 随 着 
国 值 的 减 小 而 进一步 加 剧 。 换 句 话说, 不仅 原来 图 像 中 梯度 较 大 的 边缘 区 域 得 到 了 加 强 ,而 
且 原 来 图 像 中 梯度 较 小 的 区 域 , 即 非 边缘 或 轮廓 而 仅 有 纹理 的 区 域 ( 一 般 是 不 希望 被 增强 的 
区 域 ) 也 被 加 强 了 ,过 度 增强 导致 图 像 的 视觉 质量 并 不 好 。 


5-11 利用 单方 向 灰 度 差 的 增强 











各 题 面 : 

有 这 样 一 种 图 像 增强 方式 : 在 每 个 像素 位 置 , 分 别 计算 其 水 平方 向 上 左边 一 个 位 置 和 
右边 一 个 位 置 的 两 个 像素 的 灰 度 差 了 H 和 其 垂直 方向 上 高 一 个 位 置 和 低 一 个 位 置 的 两 个 像 
素 的 灰 度 差 V。 如 果 V 二 电 , 则 将 该 像素 的 灰 度 变 为 水 平方 向 上 两 个 像素 的 灰 度 之 和 的 平 
均值 ; 否则 ,将 该 像素 的 灰 度 变 为 垂直 方向 上 两 个 像素 的 灰 度 之 和 的 平均 值 。 

(1) 该 增强 方式 的 特点 和 效果 是 什么 ? 

(2) 如 果 反 复 使 用 该 方式 ,最 终 会 获得 什么 样 的 效果 ? 

名 解析 : 

(1) 该 增强 方式 在 灰 度 变化 较 快 的 方向 保留 了 边缘 强度 又 在 灰 度 变化 较 慢 的 方向 进行 
了 平滑 ,所 以 既 能 保持 一 定 的 细节 也 能 消除 一 定 的 噪声 。 

(2) 参见 图 解 5-11 给 出 的 一 组 实验 图 像 , 其 中 图 解 5-11(a) 为 原 图 ,图 解 5-11(b) 到 图 
解 5-11(h) 依 次 为 利用 1 次 .2 次 .3 次 .5 次 .10 次 .100 次 和 200 次 该 方式 得 到 的 结果 。 巾 
图 可 见 ,如 果 反 复 利 用 该 方式 对 图 像 进行 增强 ,那么 灰 度 相差 比较 小 的 区 域 会 随 着 平均 次 数 
的 增加 而 细节 逐渐 消失 ( 变 成 灰 度 相同 的 块 区 域 ) ,图 像 越 来 越 模糊 。 另 外 ,原来 比较 接近 水 
平 或 竖 直 的 边缘 会 越 来 越 水 平 或 竖 直 ,图 像 中 会 出 现 许多 矩形 块 区 域 , 产 生 失 真 。 














(e) (人 (9 (h) 
图 解 5-11 反复 使 用 增强 方式 所 获得 的 效果 
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5-12 用 平滑 操作 实现 锐 化 操作 


各 题 面 : 

对 图 像 进 行 平滑 操作 可 得 到 平滑 图 像 , 对 图 像 进 行 锐 化 操作 可 得 到 锐 化 图 像 。 但 是 ,从 
原始 图 像 中 减 去 平滑 图 像 也 可 以 获得 锐 化 图 像 。 试 在 空域 中 借助 3X3 的 滤波 模板 来 验证 。 

各 解析 : 

设 能 获得 原始 图 像 .平滑 图 像 和 锐 化 图 像 的 3X3 滤波 模板 分 别 如 图 解 5-12(a) ,图 
解 5-12(b) 和 图 解 5-12(c) 所 示 。 


























(a) (b) (9 
图 解 5-12 3 种 3X3 滤波 模板 


将 模板 看 成 数组 /矩阵 进行 相 减 ,就 可 以 得 到 原始 图 像 一 平滑 图 像 一 锐 化 图 像 。 


5-13 ”两 个 平滑 操作 的 差 与 锐 化 操作 


气 题 面 : 

空域 中 的 锐 化 操作 效果 可 以 用 两 个 空 
域 的 平滑 操作 的 差 来 实现 。 设 有 两 个 高 斯 
平滑 函数 : hh (x) 二 Aexp( 一 2x*201?x?) 和 
hs(zx) 二 Bexp( 一 2w20s?x?), 其 中 幅度 系数 
A 宇 B, 方 差 ao。 它 们 的 差 即 h(x)= 
有 (Zz) 一 hs (zx) 的 效果 就 是 一 个 高 斯 锐 化 ， 
其 对 应 模板 函数 的 剖面 形状 如 图 题 5-13 
所 示 。 讨 论 方差 m 和 的 取 值 变化 对 ; |! ; | 
该 锐 化 模板 函数 的 形状 和 锐 化 功能 的 -1503 015 -01 05 6 5 0 0.15 
lS 响 。 
» Ss 图 题 5-13 ”高 斯 锐 化 的 模板 函数 

图 解 5-13 给 出 方差 m 和 0, 的 取 值 变化 后 的 一 些 模板 函数 形状 ,其 中 (a) 对 应 m 增 大 ， 
(b) 对 应 o 增 大 ,(c) 对 应 o 减 小 ,(d) 对 应 oz 减 小 。 由 图 可 见 当 m 或 o 增 大 时 ,h(xz) 变 窜 
(对 应 较 小 模板 ), 即 锐 化 的 作用 加 强 ; 当 o 或 0; 减 小 时 ,h(x) 变 宽 ( 对 应 较 大 模板 ), 即 锐 化 
的 作用 减弱 。 
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5 ! ! ! ! ! 
-0.2 -0.15 -0.1 -0.05 0 0.05 0.1 0.15 


(b) 




















So 
-02 -0.15 -01 -0.05 0 0.05 0.1 0.15 -02 -0.15 01 -005 0 0.05 0.1 0.15 


(d) 


图 解 5-13 方差 6 变 化 后 的 高 斯 锐 化 模板 函数 


5-14 用 不 同 模板 计算 中 值 


各 题 面 : 

设 有 一 幅 图 像 如 图 题 5-14 所 示 , 试 分 别 用 3 种 方法 
计算 其 中 心 3X3 部 分 的 中 值 ( 画 出 最 终结 果 , 对 后 两 种 还 
画 出 中 间 结 果 ) : 

(1) 直接 使 用 3X3 的 2-D 模 板 。 

(2) 先 使 用 3X1 的 1-D 模板 ,再 使 用 1X3 的 1-D 
模板 。 

(3) 先 使 用 1X3 的 1-D 模板 ,再 使 用 3X1 的 1-D 
模板 。 

各 解析 : 

3 种 方法 的 计算 结果 依次 见 图 解 5-14(a)、 图 解 5-14 
(b) 、 图 解 5-14(c) 。 




















图 题 5-14 用 于 计算 中 
值 的 图 像 
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图 解 5-14 ”中 值 计 算 结果 


5-15 ”中 值 滤 波 中 更 新 中 值 


名 题 面 : 

在 进行 中 值 滤波 时 ,要 用 其 模板 中 心 扫 过 图 像 中 的 每 个 位 置 并 读 取 对 应 模板 下 的 像素 
进行 排序 。 设 计 一 种 尽量 减少 模板 排序 工作 量 的 更 新 中 值 的 方法 。 

所 解析 : 

考虑 水 平 扫描 (垂直 扫描 原理 相同 ) 时 的 情况 。 每 次 移动 一 个 nXn 的 模板 ,只 有 其 最 左 
一 列 和 最 右 一 列 下 的 像素 发 生变 化 (其 他 模板 下 的 像素 仍 在 模板 下 ,虽然 所 对 应 的 模板 位 置 
不 同 ), 即 只 有 这 两 列 像素 影响 中 值 的 更 新 。 所 以 ,为 减少 排序 工作 量 ,在 读 取 对 应 模板 下 的 
像素 时 ,可 以 采取 先 比较 模板 移动 前 最 左 一 列 下 的 像素 值 与 当时 中 值 大 小 的 方式 来 更 新 中 
值 ,再 比较 模板 移动 后 最 右 一 列 下 的 像素 值 与 当时 中 值 大 小 的 方式 来 (第 二 次 ) 更 新 中 值 。 
这 样 ,就 可 将 原本 需要 的 对 n? 个 像素 值 的 比较 排序 工作 减少 为 对 2n 个 像素 值 的 比较 排序 
工作 。 

因为 对 个 像素 值 的 比较 排序 需要 mn? 次 运算 操作 ,所 以 采用 上 面 的 方法 排序 ,工作 量 
可 从 On) 减少 到 OG?)。 例 如 , 当 使 用 3X3 的 模板 时 ,比较 数量 可 以 从 81 降 到 18; 而 当 
使 用 5X5 的 模板 时 ,比较 数量 可 以 从 625 降 到 50。 


5-16 ”中 值 滤波 的 模板 与 消除 噪声 效果 


己 题 面 : 

试 讨论 中 值 滤波 的 消除 噪声 效果 与 所 用 模板 中 参与 (排序 ) 运 算 的 像素 个 数 有 关 的 原 
因 , 为 什么 它 与 模板 尺寸 有 关联 但 又 不 完全 与 模板 尺寸 成 比例 ? 

名 解析 : 

中 值 滤波 通过 (排序 ) 计 算 模板 所 覆盖 范围 内 像素 的 中 值 来 工作 。 如 果 模 板 范围 内 的 像 
素 个 数 比较 少 , 则 中 值 能 体现 更 多 的 图 像 细节 ; 如 果 模 板 范围 内 的 像素 个 数 比较 多 , 则 中 值 
体现 更 多 的 图 像 全 局 特点 。 所 以 中 值 滤波 的 效果 与 模板 尺寸 有 关联 。 不 过 模板 尺寸 只 是 限 
制 了 参与 排序 像素 的 最 大 个 数 ,实际 中 也 可 以 只 使 用 模板 所 覆盖 范围 内 的 部 分 像素 ,这样 可 
减少 计算 量 。 所 以 ,中 值 滤 波 的 效果 并 不 一 定 与 模板 尺寸 完全 成 比例 。 

进一步 考虑 当 只 使 用 模板 所 覆盖 范围 内 的 部 分 像素 时 ,因为 可 有 许多 方法 选择 这 部 分 
像素 ,所 以 中 值 滤波 的 效果 不 一 定 与 所 使 用 的 模板 下 像素 个 数 成 比例 。 
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S-17 


气 题 面 : 


(1) 试 概述 均值 滤波 和 中 值 滤波 各 自 的 特点 并 进行 相互 对 比 。 


不 同 滤波 方法 的 特点 和 对 比 


(2) 试 概述 最 大 值 滤波 和 最 频 值 滤波 各 自 的 特点 并 进行 相互 对 比 。 
名 解析 : 
(1) 均值 滤波 与 中 值 滤波 各 自 的 特点 和 相互 对 比 见 表 解 5-17(1)。 


比较 项 


表 解 5-17(1) 
各 自 特 点 


均值 滤波 与 中 值 滤波 的 特点 和 对 比 


相互 对 比 





均值 滤波 


均值 滤波 通过 “取长补短 ”来 降低 噪声 的 影响 , 它 更 适合 用 于 消 
除 高 斯 噪声 。 

均值 滤波 会 模糊 边缘 ,因为 它 产生 背景 灰 度 和 前 景 灰 度 混合 的 
边缘 剖面 ,所 以 会 减少 两 个 区 域 之 间 的 局 部 对 比 度 





中 值 滤波 





下 信息 各 二 除 必 基 度 的 时 局 洒 放 用 隐语 它 更 适 
于 消除 脉冲 噪声 。 它 能 在 成 功 消除 噪声 的 同时 不 产生 任何 
局 部 模 枯 。 它 趋向 于 保持 单调 增 / 减 的 信号 的 顺序 不 变化 。 

使 用 中 值 滤波 有 可 能 引入 边缘 的 移动 ,有 导致 产生 常数 值 游程 的 倾 
向 。 中 值 滤波 的 计算 量 很 大 ,至 少 正比 于 它 所 使 用 的 模板 的 面积 




















均值 滤波 将 所 有 噪声 值 都 
平均 加 到 信号 之 中 ; 而 中 
值 滤波 将 可 将 噪声 排除 在 
信号 之 外 。 

均值 滤波 将 野 点 也 包括 在 
内 而 盲目 地 平均 所 有 值 ; 
中 值 滤波 有 选择 地 进行 统 
计 , 忽 略 了 野 点 


(2) 最 大 值 滤波 与 最 频 值 滤波 各 自 的 特点 和 相互 对 比 见 表 解 5-17(2) 。 














表 解 5-17(2) ”最 大 值 滤 波 与 最 频 值 滤 波 的 特点 和 对 比 
比较 项 各 自 特 点 相互 对 比 
最 大 值 滤波 作用 在 一 幅 ( 暗 目标 在 亮 背 景 上 的 ) 图 像 时 , 亮 的 背景 | 最 频 值 滤波 与 最 大 值 滤 波 
最 大 值 | 区 域 将 扩张 ,并 趋向 于 减 小 目标 的 尺寸 ,或 甚至 消除 小 的 目标 。 在 高 曲率 的 轮廓 附近 都 会 
滤波 最 大 值 滤 波 趋向 于 在 图 像 中 产生 常数 (高 ) 灰 度 的 区 域 , 且 在 | 趋向 于 减 小 曲率 的 变化 。 
( 暗 ) 目 标 轮廓 的 角 点 处 趋向 于 插入 目标 中 不 同 之 处 在 于 最 频 值 滤波 
最 频 值 滤波 不 仅 可 以 消除 噪声 (尤其 是 脉冲 噪声 ) ,还 可 以 锐 化 | 对 背景 和 前 景 进行 对 称 的 
最 频 值 | 边缘 。 它 趋向 于 保留 边缘 , 且 不 会 显著 地 移动 边缘 位 置 而 导致 | 操作 ,而 最 大 值 滤波 仅 对 
滤波 目标 尺寸 的 减少 。 高 曲率 轮廓 的 暗 边 产生 
最 频 值 滤波 在 高 曲率 的 轮廓 附近 会 趋向 于 减 小 曲率 变化 影响 
5-18 用 低 通 滤波 实现 高 通 滤波 
忌 题 面 : 


利用 低 通 滤波 可 以 得 到 低 通 滤 波 图 像 , 利 用 高 通 滤波 可 以 得 到 高 通 滤波 图 像 。 但 是 ,如 
果 从 原始 图 像 中 减 去 低 通 滤波 图 像 也 可 以 获得 高 通 滤 波 图 像 。 试 在 频 域 中 证 明 这 一 点 。 
妆 解 析 : 
设 原始 图 像 的 傅 里 叶 变换 为 F(u, v) , 低 通 滤波 器 的 转移 函数 为 D(u, wv) ,高 通 滤 波 器 
的 转移 函数 为 G(u, v)。 通 过 设计 ,可 使 得 D(w, v) 十 G(u, v) 二 1, 即 低 通 滤波 器 和 高 通 滤 
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波 器 的 转移 函数 互补 。 这 样 ,在 频 域 内 用 原始 图 像 的 傅 里 叶 变 换 减 去 低 通 滤波 图 像 的 傅 里 
叶 变 换 将 是 Fu, v) 一 Fl(u, D(au, v)=F(u, v)X[1—D(u, v) =F(u, v)G(u, v)。 所 
以 ,通过 傅 里 叶 反 变换 转换 到 空域 中 就 可 得 到 高 通 滤波 图 像 。 


5-19 用 两 个 低 通 滤波 器 构建 一 个 高 通 滤波 器 


各 题 面 : 

在 频 域 中 ,一 个 高 通 滤波 器 的 效果 可 以 用 两 个 低 通 滤波 器 来 实现 。 设 有 两 个 高 斯 低 通 
滤波 器 , 即 Hi (wu) 二 Aexp( 一 ww/20?) 和 日,(u) 二 Bexp( 一 w/202), 其 中 幅度 系数 A 三 B, 方 
差 gos。 它们 的 差 即 也 (4w) 二 Hi(w) 一 HH (ww) 是 一 个 高 斯 高 通 滤波 器 ,其 转移 函数 如 图 题 
5-19 所 示 。 讨 论 方差 m 和 m 的 取 值 变化 对 该 滤波 器 形状 和 滤波 功能 的 影响 。 
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EE EE 
图 题 5-19 ”高 斯 高 通 滤波 器 的 转移 函数 

各 解析 : 

图 解 5-19 给 出 方差 c 和 o 的 取 值 变化 后 的 一 些 转移 函数 曲线 ,其 中 图 解 5-19(a) 对 
应 wo 增 大 ,图 解 5-19(b) 对 应 o2 增 大 ,图 解 5-19(c) 对 应 o 减 小 ,图 解 5-19(d) 对 应 oo 减 
小 。 由 图 可 见 , 当 m 或 w 增 大 时 , 瓦 (x) 变 宽 ( 对 应 截断 频率 升 高 ), 即 可 以 保留 更 多 的 高 频 
部 分 ; 当 o 或 m 减 小 时 ,及 (x) 变 窄 (对 应 截断 频率 降低 ) , 即 部 分 高 频 会 被 减弱 。 
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图 解 5-19 5 变化 后 的 高 斯 高 通 滤波 器 转移 函数 
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图 解 5-19( 续 ) 


5-20 巴特 沃 斯 带 通 滤 波 器 


各 题 面 : 
试 写 出 能 通过 水 平 频率 为 500Hz 和 垂直 频率 为 50Hz 的 模式 、 截 断 频率 为 5Hz 的 二 阶 
巴特 沃 斯 带 通 滤波 器 的 表达 式 。 
如 解析 : 
带 通 滤波 器 允许 通过 的 频率 不 以 原点 为 中 心 , 且 需要 两 两 对 称 地 工作 ,所 以 满足 要 求 的 
二 阶 巴 特 沃 斯 带 通 滤波 器 的 表达 式 为 
1 














人 
其 中 ， 
Di(usv) = [(u—500)? + (vo—50)°]? 
Dz(usv) = [(ut+500)? 十 (十 50)2]22 
5-21 巴特 沃 斯 低 通 滤波 消除 虚假 轮廓 
各 题 面 : 


试 从 空域 的 角度 出 发 说 明 为 什么 使 用 巴特 沃 斯 低 通 滤波 器 可 以 消除 虚假 轮廓 。 
如 解析 : 
考虑 巴特 沃 斯 低 通 滤波 器 的 转移 函数 ,如 果 取 n= 二 1, 忽 略 高 阶 量 , 用 泰勒 级 数 将 其 展开 
写成 
1 1 a w+ 
1+ [DGu,v)/D, J: 1 十 此 南 D: 


H(u,v) 











这 样 ,滤波 输出 图 像 的 傅 里 叶 变 换 为 
Glu,v) = Hl(u,v)F (u,v) [ el 


Ds 








2 2 
] Fe Fl(u,v) Fe DE) 
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对 它 进 行 传 里 叶 反 变换 ,得 到 输出 图 像 的 空域 表示 , 即 
I fC) | feyy) 
| qr ay ] 
这 个 结果 相当 于 从 输入 图 像 中 减 去 了 一 个 与 二 阶 偏 导 之 和 成 正比 的 项 ,对 应 一 个 拉 普 
拉 斯 算 子 。 因 为 拉 普 拉 斯 算 子 可 以 锐 化 图 像 ,所 以 从 输入 图 像 中 减 去 锐 化 结果 可 平滑 图 像 
而 消除 虚假 轮廓 。 





SCry) = f(r,y) 





5-22 ” 邻 域 平均 对 应 的 滤波 器 


各 题 面 : 

考虑 图 像 中 任 一 个 像素 点 f(x, y) 的 4 个 4- 近邻 像素 (不 算 该 像素 本 身 ), 可 以 借助 邻 
域 平均 来 构建 一 个 低 通 滤波 器 。 

(1) 给 出 它 在 频 域 的 等 价 滤波 函数 H(u, vw)。 

(2) 证 明 所 得 结果 确实 是 一 个 低 通 滤波 器 。 

各 解析 : 

(1) 在 空域 中 进行 4 个 4- 近 邻 像 素 的 邻 域 平均 ( 设 加 权 系 数 均 为 1) ,得 到 

g (zyy) = 了 {f(z la rl rp 1 

对 其 进行 傅 里 叶 变换 (借助 平移 性 质 ) ,得 


Gl(u,v)= FT {FCs exp(j2ru/N) 十 Fl(u,v)exp( 一 j2xu/N)} 十 





于 F(u,v)exp(j2xv/N) + F(u,v)exp(— j2xv/N)} 


= FFCus Leos2nu/N) 十 cos(2xv/N)] 
所 以 在 频 域 中 的 等 价 滤波 函数 为 
H(u,v) = 去 [eos(2nu/N) 二 cos(2xv/N)] 


(2) 上 述 滤 波 器 以 N 为 周期 ,在 4==0,v==0 时 取 到 最 大 值 ,在 一 个 周期 内 , 随 着 频率 值 的 
增加 其 幅 值 逐渐 减 小 (如 图 解 5-22 所 示 ) ,这 表明 该 滤波 器 的 功能 相当 于 一 个 低 通 滤波 器 。 





图 解 5-22” 频 域 中 的 等 价 滤波 函数 
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5-23 ” 邻 域 差 分 对 应 的 滤波 器 


各 题 面 : 
计算 图 像 中 两 个 相 邻 像素 点 f(x, y) 和 f(z 十 1, y) 或 f(x, y) 和 f(x, y 十 1) 的 差分 可 
获得 梯度 。 
(1) 给 出 上 述 操 作 在 频 域 所 对 应 的 滤波 器 转移 函数 H(u, wv)。 
(2) 证 明 所 得 结果 相当 于 一 个 高 通 滤 波 器 的 滤波 函数 。 
所 解析 : 
(1) 以 对 f(x, y) 和 f(z 十 1, y) 计 算 差 分 为 例 ( 对 f(x, y) 和 f(x,y 十 1) 也 类 似 ): 
g(Czyy) = f(zx+it1,y)— f(r,y) 
再 对 结果 进行 傅 里 叶 变 换 (借助 平移 性 质 ) ,得 到 
Gl(usv) = Fl(u,v) (exp(j2ru/N)—1} 
所 以 滤波 器 转移 函数 及 (u, wv) 为 
H(u,v) = exp(j2rx/N) 一 1 
(2) 取 转 移 函 数 了 (u,v) 的 模 , 有 
HG,v) || = | cosC(2ru/N)—1+j. sin(2xu/N) | 
= [cos(2xu/N) — 1J + sin’ (2xu/N) = 2[1— cos(2xu/N)] 
由 上 式 可 知 ,转移 函数 以 N 为 周期 ,在 ==0,v=0 取 到 最 小 值 , 随 着 频率 值 在 一 个 周期 
内 的 增加 而 单 增 , 这 对 应 于 一 个 高 通 滤波 器 。 
图 解 5-23 给 出 对 转移 函数 的 幅 值 函数 的 一 个 实验 计算 结果 ,符合 高 通 滤波 器 的 情况 。 


| 














4 32 -1 0 1 2 3 4 
图 解 5-23 ”转移 函数 的 幅 值 函数 曲线 


5-24 滤波 器 分 解 


名 题 面 : 
可 以 证 明 : 如 果 在 连续 域 中 有 两 个 滤波 器 h， 和 hs, 用 它们 依次 对 一 幅 连 续 图 像 f 进行 
( 卷 积 ) 滤 波 得 到 的 结果 (Cima )C9h, ) 与 先 将 两 个 滤波 器 卷 积 得 到 一 个 滤波 器 h(h 二 hy Chs) 
。59 。 


再 用 hh 对 了 进行 ( 卷 积 ) 滤 波 得 到 的 结果 (f@ (hi1@hs)) 是 相同 的 。 这 个 结果 可 以 推广 到 离 
散 域 中 吗 ? 

所 解析 : 

这 个 结果 可 以 推广 到 离散 域 中 ,条 件 是 离散 图 像 应 是 无 穷 尺寸 的 。 如 果 离 散 图 像 是 有 
限 尺寸 的 ,那么 滤波 结果 就 会 根据 处 理 图 像 边界 上 像素 方法 的 不 同 而 不 同 。 


5-25 ”空域 模板 的 设计 





各 题 面 : 

如 果 给 定 了 滤波 器 的 转移 函数 及 (u,v) ,讨论 如 何 根据 它 设 计 出 对 应 的 空域 模板 , 列 出 
气 解析 : 

主要 步骤 有 3 个 : 


(1) 对 及 (u,v) 进行 傅 里 叶 反 变换 ,得 到 h(x, y)。 
(2) 根据 空域 模板 的 尺寸 ,对 h(x， y) 进 行 相应 的 采样 ,得 到 模板 各 个 元 素 的 值 。 
(3) 对 采样 归 一 取 整 ,使 最 小 的 模板 值 为 1, 其 他 值 为 整数 。 


s-26 ”对 椒盐 噪声 的 线性 滤波 


名 题 面 : 

试 分 析 为 什么 一 般 线 性 滤波 消除 椒盐 噪声 的 效果 会 较 差 。 

如 解析 : 

先 从 空域 角度 分 析 。 一 般 的 线性 滤波 采用 一 个 小 模板 对 图 像 进行 卷 积 来 实现 (平滑 ) 滤 
波 。 此 时 椒盐 噪声 会 被 (加 权 ) 平 均 而 减弱 ,但 同时 图 像 中 原来 的 细节 也 可 能 被 平滑 掉 。 另 
外 ,椒盐 噪声 取 极 端的 灰 度 值 ,所 以 平均 操作 会 给 一 个 噪声 点 周围 的 像素 加 上 一 定 的 噪声 ， 
使 得 噪声 产生 扩散 。 它 们 都 会 导致 图 像 的 视觉 效果 变 差 。 

再 从 频 域 角度 分 析 。 消 除 噪声 的 线性 滤波 器 在 频 域 中 对 应 低 通 滤波 器 (主要 保留 低频 
段 的 频率 分 量 ) 。 椒 盐 噪声 在 空域 上 为 脉冲 噪声 ,而 在 频 域 上 其 频谱 的 范围 很 广 ,这 样 在 线 
性 滤波 器 的 作用 下 只 有 高 频率 分 量 被 消除 ,而 未 被 消除 的 频率 分 量 在 空域 上 仍 表现 为 噪声 ， 
因此 线性 滤波 器 消除 椒盐 噪声 的 效果 会 较 差 。 
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图 像 恢 复 也 称 图 像 复 原 , 是 图 像 处 理 中 的 一 大 类 技术 。 图 像 恢 复 的 目标 是 要 改善 输入 
图 像 的 视觉 质量 ,不 过 它 的 出 发 点 是 认为 要 恢复 的 图 像 ( 质 量 ) 是 在 某 种 情况 /条 件 下 由 原始 
图 像 退 化 或 恶化 (图 像 品 质 下 降 、 失 真 ) 而 得 到 的 ,现在 需要 根据 相应 的 退化 模型 和 知识 重建 
或 恢复 原始 的 图 像 。 换 句 话 说 ,图 像 恢复 技术 是 要 将 图 像 退 化 的 过 程 模 型 化 ,并 根据 所 确定 
的 图 像 退化 模型 来 进行 有 针对 性 的 复原 ,以 获得 期 望 的 效果 。 

图 像 恢复 的 关键 是 要 建立 图 像 退 化 的 模型 。 由 于 造成 图 像 退化 的 因素 很 多 ,如 噪声 、 模 
糊 、 干 扰 \ 剪 切 等 ,所 以 要 对 这 些 退化 源 进行 深入 剖析 。 在 模型 已 确定 的 情况 下 ,可 以 采取 无 
约束 的 技术 (如 逆 滤 波 ) 或 者 有 约束 的 技术 (如 维 纳 滤波 和 有 约束 最 小 平方 滤波 ) 来 进行 恢 
复 。 图 像 退化 的 表现 多 种 多 样 ,图 像 恢 复 的 工作 也 不 同 。 例 如 ,图 像 的 几何 失真 主要 表现 为 
像素 的 相对 位 置 的 变化 ,所 以 需要 恢复 像素 的 空间 关系 ; 图 像 的 缺损 主要 表现 为 部 分 像素 
的 缺失 ,所 以 需要 对 图 像 进行 修复 和 填充 。 近 年 来 ,这 类 修补 技术 得 到 了 大 量 应 用 。 同 样 得 
到 广泛 关注 的 还 有 图 像 去 雾 的 问题 ,目前 主要 也 是 采取 图 像 恢 复 的 思路 来 改善 。 通 过 构建 
图 像 降 质 的 模型 ,借助 先 验 知识 有 针对 性 地 恢复 图 像 。 

图 像 恢 复 的 基本 思想 是 根据 退化 原因 进行 相应 的 恢复 。 从 这 个 观点 来 看 ,从 投影 重建 
图 像 也 是 一 类 特殊 的 图 像 恢复 技术 。 这 里 投影 可 看 成 是 一 种 退化 过 程 而 重建 过 程 则 可 看 成 
是 一 种 复原 过 程 。 常 见 的 CT、EIT、MRI 等 成 像 技术 将 景物 内 部 信息 转化 为 一 系列 投影 ， 
从 这 些 投影 可 以 重建 出 景物 内 部 的 结构 分 布 。 常 用 的 方法 包括 傅 里 叶 反 变换 法 、 卷 积 投影 
法 ,代数 迭代 法 等 。 

本 章 的 问题 涉及 上 述 图 像 恢复 多 个 方面 的 概念 。 


6-1 几何 失真 的 双 线性 校正 


气 题 面 : 

在 根据 图 题 6-1 进行 的 几何 失真 校正 中 ,左边 的 失真 图 g(x ',y) 和 右边 的 校正 图 
f(x, yy) 都 以 左下 角 为 原点 ,网 格 为 单位 网 格 。 如 果 g(1, 1)==1,g(7, 1) 一 7,g(1,，7) 一 7， 
g(7,7) 二 14, 求 点 f(2, 4) 在 使 用 双 线 性 几何 校正 后 再 用 双 线 性 插值 得 到 的 灰 度 值 。 

各 解析 : 

利用 双 线 性 几何 失真 公式 .借助 4 对 点 的 对 应 关系 ,可 得 到 8 个 一 组 的 线性 方程 

1 一 局 十 已 十 人 as 十 有 
2 二 ks 十 ke 十 kr 十 ks 
6 二 7ki 十 kz 十 7ks 十 k 

















图 题 6-1 失真 图 和 校正 图 








1 = 7ks 二 ko 十 7k; 十 ks 
7 = 7hk 十 7ks 十 49ks 二 ks 
6 = 7ks + 7ke + 49k; + ks 
2 二 锯 十 ?kz 十 ?ks 十 kk 
. As 十 7Re 十 7R7 十 Rs 
联 立 解 得 : &1 二 5/6,ks 二 1/6,ks 二 0,k4 二 0,ks 1/6,ks=5/6,k;=0,ks=4/3。 
利用 后 向 映射 ,与 f(x，y) 对 应 的 g(x’,，y ) 是 g(8/3, 13/3)。 先 算得 点 g(2, 4) 二 6， 
g(3, 4) 一 7,g5(3，5) 一 8,g(2，5) 一 7, 再 利用 双 线 性 插值 得 到 f(2, 4) 一 7。 


6-2 ”恢复 转移 函数 的 形式 









































如 题 面 : 
常见 的 恢复 转移 函数 M(u, v) 有 两 种 形式 。 一 种 是 
1/H(usv)， 如 十 ww 过 ww 


M(u,v) “| 
ls 如 十 二 wi 
其 中 ,HH(u, v) 是 退化 函数 ,对 re 的 选取 原则 是 将 态 (u, wv) 中 为 0 的 点 除去 。 另 一 种 是 
k, 如 Hl(u,v) 三 4d 
M(u,v) | 
1/H(u,v)， 其 他 


其 中 和 4d 均 为 小 于 1 的 常数 ,而 且 d 选 得 较 小 为 好 。 
(1) 哪个 恢复 转移 函数 的 效果 相对 较 好 ? 
(2) 还 可 用 什么 样 的 恢复 转移 函数 以 取得 更 好 的 效果 ? 
所 解析 : 
(1) 后 一 个 恢复 转移 函数 的 效果 相对 较 好 。 这 里 前 一 个 恢复 转移 函数 将 恢复 运算 的 频 
谱 范围 进行 了 限制 ,类 似 于 门 函数 的 恢复 转移 函数 会 导致 振 铃 效 应 比较 明显 。 后 一 个 恢复 
转移 函数 在 有 H(u, wv) 取 较 小 值 (有 可 能 出 现 奇异 解 ) 的 时 候 让 M(u, v) 取 一 个 固定 的 有 限 
值 ,避免 了 NC(u, wv)/HH(u, v) 对 恢复 结果 造成 较 大 的 影响 ,所 以 效果 较 好 。 

(2) 如 果 能 对 后 一 个 恢复 转移 函数 进行 改进 ,使 的 值 随 太 (x, v) 而 变化 , 则 有 可 能 进 
一 步 减 小 M(u， vw) 而 使 N(u, v)/H(u, v) 对 恢复 结果 造成 的 影响 更 小 。 
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6-3 ”分 段 换 方向 运动 的 转移 函数 


名 题 面 : 

为 消除 匀速 直线 运动 模糊 ,需要 分 析 物 体 的 运动 情况 。 如 果 一 个 物体 先 在 X 方向 上 运动 了 
T, 时 间 , 其 后 转 为 在 Y 方向 上 又 运动 了 了 T, 时 间 ,推导 这 种 情况 下 用 于 图 像 恢复 的 转移 函数 。 

气 解 析 : 

在 0 到 了 之 间 采 集 到 的 图 像 为 


ew = [7 一 Zzo(tz),y]dt- 
在 到 T, 之 间 采 集 到 的 图 像 为 
已 .3 
Ew (xy) = | gzLzx,y — yolty)Jdt, = 上 直 Fl — zy — WY dads, 
对 它 进行 傅 里 叶 变换 ,得 到 


CCuyu) 一 下 烛 gx(zyy)exp[ 一 2jr(Cuiz 十 zy)]dzdy 
in pe po 
= | | | | f[z— zolti) ,yO— yolty)Jexp[— 2jrCuz tvy) dzrdyl dtdt, 
0 J0 -ood -oo 


eT fT, 
= Pu)) | {exp[— ZnCl) + eyo6t))]) desde 
如 果 定 义 
EE 
H(u,v) = | a {exp[— 2jr (uro ti) vyo ty,)) J} dtdt, 
0 0 


则 得 到 Gu, v)= 二 Flu, v)HH(u, v), 即 有 H(u, wv) 为 需要 的 转移 函数 。 如 果 令 zo ( 太 ) 一 
Catz/Tz ,yyolty) 二 cyty/Ty, 则 对 昌 (u，, wv) 积分 ,可 得 


时 Et 
H(u,v)= 下 {exp[ 一 2jrucsts/T ide| ”{exp[ 一 2jxzcvty/Ty])dzy 


一 es )sin(xw, )exp[ 一 jx(ucz 十 we 
IT MUCzCy 


6-4 匀 加 速 运动 所 造成 的 模糊 


各 题 面 : 

设 图 像 模糊 是 由 物体 的 匀 加 速 运动 所 产生 的 。 当 一 0 时 物体 静止 ,在 :一 0 到 :一 人 工 之 
间 物 体 运动 分 量 是 x(1) 二 at?/2,y(t) 二 0。 

(1) 求 描述 运动 的 转移 函数 H(u, v)。 

(2) 相 比 于 匀速 运动 , 匀 加 速 运动 所 造成 的 模糊 有 什么 不 同 ? 

忌 解 析 : 

(1) 将 运动 分 量 代入 有 H(u. v) 的 计算 公式 ,有 


y 2 at2 
Heo= | exp{— j2x[uz (1) 十 zy(t]}dz 一 | exp[— j2ru “| 
0 o 


至 
一 | exp[— jxaut? ]dz 
0 
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上 述 积分 (可 表示 为 菲 涅 耳 积 分 ) 在 工 趋 向 于 无 穷 时 为 有 限 值 , 所 以 在 工 为 有 限 值 时 应 
为 较 小 的 正 值 ( 也 可 借助 级 数 展开 分 析 ) 。 

(2) 对 匀速 运动 造成 的 模糊 ,由 于 瓦 (w，zv) 可 能 在 uv 平面 上 的 某 些 位 置 取 零 或 很 小 ， 
从 而 使 得 恢复 结果 与 预期 的 结果 有 很 大 的 差距 。 而 对 匀 加 速 运 动 造成 的 模糊 ,由 于 其 
HH(u, v) 没 有 在 uv 平面 上 取 零 的 点 , 则 没有 这 个 问题 。 


6-5 有 约束 最 小 平方 恢复 滤波 器 的 转移 函数 


气 题 面 : 

设 一 台 X 射线 成 像 设 备 所 产生 的 图 像 模 糊 可 以 模型 化 为 一 个 卷 积 过 程 , 其 卷 积 函 数 
是 : h(7)= 二 [rr 一 202 /ot ]exp[ 一 rr/20?j], 其 中 并 = 十 y*Y。 可 见 , 这 里 的 卷 积 函数 为 轮换 对 
称 的 。 设 为 恢复 这 类 图 像 要 设计 一 个 有 约束 最 小 平方 恢复 滤波 器 ,请 推导 它 的 转移 函数 。 

气 解 析 : 

有 约束 最 小 平方 恢复 滤波 器 的 转移 函数 为 


H"* (u,v) 
| Hl(u,v) | 十 s| Plu,v) | 


其 中 五 (u,v) 可 由 对 有 h(x) 二 h(xz，y) 的 傅 里 叶 变 换 得 到 ( 取 正 方形 图 像 , 即 M 王 N) , 即 


WE 和 2 2 
H(u,v) 二 2 2 六 一 exp[ 和 se ]exrE j2x (uz + vy)/M] 




















R(u,v) = 























y=0 z=0 
进一步 得 
MI1M!1 2 : 机 2 
H" (u,v) 立 乞 之 re 和 ep| i ]expli2rCur 二 vy)/M] 
其 中 
1 M-1 M-1 
P(u,v) 一 一 plzx,y)exp[— j2xCuz + vy)/M] 
WV z=0 
起! exp[— j2xv/M] — exp[— j2xu/M] — exp[— j2x(u + 2v)/M]J 


exp[— j2x(2u++ wv)/M]++ 4exp[—j2x(u v) /MJ} 
将 及 (u,v)、H* (u,v) 和 P(u, v) 代 入 滤波 器 的 转移 函数 公式 就 可 求 得 有 约束 最 小 平 
方 恢复 滤波 器 。 





6-6 ”正弦 模式 干扰 的 消除 


名 题 面 : 

设 一 幅 图 像 受到 正弦 模式 的 干扰 ， 

(1) 在 图 像 的 傅 里 叶 空间 画 出 用 交互 式 方法 消除 这 个 干扰 模式 的 示意 图 。 

(2) 当 用 理想 带 阻 滤波 器 来 消除 这 个 干扰 模式 时 ,如 果 滤 波 器 的 半径 过 大 则 会 产生 比 
较 明 显 的 振 铃 效应 ,为 什么 ? 

扣 解 析 : 

(1) 傅 里 叶 空 间 中 的 示意 图 如 图 解 6-6 所 示 , 其 中 两 个 白 点 代表 对 应 干扰 模式 的 两 个 
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频率 点 ,两 个 白色 辆 环 对 应 用 来 消除 干 扩 模 式 的 带 阻 渡 波 器 的 截断 频率 。 如 果 正 弦 模 式 的 
水 平 频率 与 垂直 频率 相同 , 则 两 个 白 点 正好 在 对 角 线 上 ( 兄 图 解 6-6(a)); 但 如 果 正弦 模式 
的 水 平 频率 与 垂直 频率 不 同 , 则 两 个 白 点 会 对 称 地 
偏离 对 角 线 ( 见 图 解 6-6(b) ) 。 (©) ©) 

(2) 理想 带 阻 滤波 器 在 渡 除 正弦 干扰 模式 时 也 
会 滤 除 受 干扰 图 像 中 的 干扰 模式 频率 之 外 的 一 些 频 
率 分 量 (如 在 图 解 6-6 中 自 点 与 白色 辕 环 之 间 的 部 
分 ) ,从 而 产生 振 铃 效应 。 如 果 滤 除 的 频率 分 量 越 
多 , 则 产生 的 振 锥 效应 也 会 越 明显 。 当 滤波 器 的 半 
径 比 较 大 时 ,被 滤 除 的 频率 分 量 就 比较 多 ,所 以 产生 。 图解 55 消除 开拓 模式 的 带 阻 凡 波 品 
的 振 铃 效应 也 会 比较 明显 。 


6-7 ”正弦 模式 干扰 与 匀速 直线 运动 模糊 的 对 比 


名 题 面 : 

正弦 模式 干扰 与 匀速 直线 运动 模糊 对 图 像 造成 的 影响 有 什么 不 同 ? 

如 解析 : 

正 性 模 式 的 干扰 是 到 加 在 原 图 像 上 的 , 受 干 扰 图 像 上 会 出 现 周期 性 变化 的 模式 。 正 弦 
模式 的 频率 单一 , 它 在 频率 域 中 与 原 图 像 的 频率 是 相 加 的 关系 ,所 以 可 较 方便 地 借助 带 阻 滤 
波 器 减弱 或 消除 。 匀 速 直 线 运动 模糊 导致 的 影响 是 与 原 图 像 相 卷 积 的 ,使 得 图 像 沿 运动 方 
向 产生 模糊 。 在 频率 域 中 ,匀速 直线 运动 模糊 的 频率 与 原 图 像 的 频率 是 相 乘 的 关系 ,需要 在 
空域 中 估计 出 运动 情况 后 才能 用 逆 滤 波 进行 消除 。 


6-8 图 像 修复 和 图 像 补 全 的 对 比 


© © 


各 题 面 : 

列 出 几 个 图 像 修 补 中 ,图 像 修复 和 图 像 补 全 的 不 同 之 处 。 

如 解析 : 

(1) 图 像 修 复 常 指 修补 尺度 较 小 的 区 域 , 而 图 像 补 全 常 指 修补 尺度 较 大 的 区 域 。 

(2) 从 功能 上 讲 ,图像 修复 多 用 于 图 像 复 原 而 图 像 补 全 多 用 于 景物 移 除 。 

(3) 图 像 修 复 多 利用 图 像 的 局 部 结构 信息 ,但 不 太 考虑 利用 图 像 的 纹理 信息 ,而 图 像 补 
全 则 常常 需要 考虑 整 幅 图 像 的 全 局 信息 ,并 且 要 考虑 借助 图 像 的 纹理 信息 。 

(4) 图 像 修 复 的 目标 经 常 是 要 尽量 去 恢复 原始 的 图 像 ( 不 留 痕迹 ) ,这 时 可 用 信 噪 比 等 
指标 来 衡量 图 像 修 复 结果 的 好 坏 。 图 像 补 全 的 目标 常常 是 要 在 景物 去 除 后 ,使 得 补 全 后 的 
图 像 在 视觉 上 如 同 真实 图 像 一 样 ,这 种 情况 一 般 多 只 能 以 人 了 眼 观 察 的 结果 来 判断 图 像 补 全 
结果 的 好 坏 。 
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6-9 大 写 英文 字母 的 投影 


各 题 面 : 

用 7X5 的 点 阵 就 可 以 构成 所 有 的 大 写 英文 字母 ( 见 图 题 6-9)。 如 果 将 它们 进行 垂直 
投影 ,就 会 发 现 有 些 字 母 具有 相同 的 投影 ,如 M 和 WS 和 Zz。 此 时 如 果 对 它们 再 加 一 个 水 
平 投影 就 有 可 能 解决 这 个 问题 (将 所 有 字母 都 区 分 开 来 ) 。 现 在 要 问 : 

(1) 一 定 需要 这 样 两 个 投影 吗 ? 

(2) 还 有 什么 方法 可 以 进一步 完善 方案 ? 


HELDEFLHI 
kLMNOPE 
RSTUYHm YE 


图 题 6-9 用 7X5 点 阵 构 成 的 大 写 英文 字母 

















各 解析 : 

(1) 先 做 出 所 有 大 写字 母 的 垂直 和 水 平 投影 ,它们 分 别 如 图 解 6-9(a) 和 图 解 6-9(b) 所 
示 。 由 图 可 以 看 出 ,没有 任何 两 个 字母 具有 相同 的 两 个 投影 ,所 以 用 这 样 两 个 投影 是 可 以 区 
分 所 有 大 写字 母 的 。 进 一 步 仔细 观察 还 可 发 现 , 没 有 任何 两 个 字母 具有 相同 的 水 平 投影 ,所 
以 仅 用 水 平 投影 也 是 可 以 区 分 所 有 大 写字 母 的 。 

(2) 上 述 情 况 表 明 ,大 写字 母 在 垂直 结构 上 的 信息 比 水 平 结 构 上 的 信息 多 。 这 个 事实 
可 通过 一 个 小 实验 来 验证 。 如 果 将 一 行 字母 的 下 半 部 挡住 ,你 仍 可 读 出 它们 ; 但 如 果 将 一 
行 字母 的 上 半 部 挡住 ,你 就 认 不 出 它们 了 。 


ULUELEULFELLEFECIC 
JLLUUuLw 【上 TFIEFE 
belUuluLsm FETL TFTET EC 


图 解 6-9 大 写字 母 的 垂直 和 水 平 投影 


(3) 一 种 更 完善 的 方案 是 在 从 上 向 下 扫描 的 同时 从 左 向 右 读 字母 ,但 这 样 相当 难 。 
种 可 行 的 改进 方案 是 使 用 倾斜 的 窗 缝 从 左 向 右 扫 描 。 





E 
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6-10 ”特殊 图 像 的 投影 重建 


各 题 面 : 

试 证 明 : 

(1) 如 果 f(x, y) 是 旋转 对 称 的 ,那么 它 可 以 由 单个 投影 来 进行 投影 重建 。 

(2) 如 果 f(x, y) 可 以 分 解 成 g(xz) 和 hh(y) 的 乘积 ,那么 它 可 以 由 两 个 与 坐标 轴 垂 直 的 
投影 来 进行 投影 重建 。 

扣 解 析 : 

(1) 如 果 f(z, y) 是 旋转 对 称 的 ,那么 它 在 各 个 方向 上 的 投影 都 是 相同 的 ( 即 知道 单个 
投影 也 就 知道 了 所 有 投影 ), 所 以 可 以 由 任 一 方向 上 的 单个 投影 来 进行 重建 。 

(2) 设 f(z, yy) 在 X 轴 上 的 投影 为 S(z), 在 Y 轴 上 的 投影 为 T(y), 则 

SK) = [fe,pay = gw) hdy 


+ + 
T(y) = 站 ed 一 ny) gen)de 
上 两 式 中 的 积分 均 应 为 有 限 常 数 , 设 分 别 为 瓦 和 G, 则 有 
S(z) T(y) 
H G 
可 见 ,f(z，y) 可 以 由 两 个 与 坐标 轴 垂 直 的 投影 来 重建 。 


6-11 傅 里 时 变换 投影 定理 的 证 明 


(zy) = g(x)h(y) 一 








所 题 面 : 
试 证 明 傅 里 时 变换 投影 定理 。 
气 解 析 : 


对 傅 里 叶 变 换 投影 定理 的 证 明 可 表述 为 : 证 明 图 像 f(x, y) 在 与 X 轴 成 0 角 的 直线 上 
投影 的 傅 里 叶 变 换 是 F(z，y) 的 傅 里 叶 变 换 在 朝向 角 0 上 的 一 个 截面 。 不 失 一 般 性 ,可 取 
0 一 0。 

设 图 像 f(x, y) 在 X 轴 上 的 投影 为 g,(z), 则 有 

= 站 rody 
其 傅 里 叶 变换 为 
区 二 | gC)exp[— i2rur Jdy 全 站 | 站 resesp[-izrurldzdy 
另 一 方面 ,f(x,y) 的 傅 里 叶 变 换 为 
二 二 [ewe i 
将 上 式 中 的 v 取 为 零 , 则 得 到 G, (ww) 二 FC(u, 0) ,所 以 傅 里 叶 变换 投影 定理 得 证 。 
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6-12 ” 扇 束 投影 实验 结果 


名 题 面 : 
扇 束 投影 重建 的 质量 与 接收 器 之 间 的 夹 角 相 关 。 试 用 卷 积 逆 投 影 方法 并 选取 不 同 的 接 
收 器 夹 角 进行 重建 ,分 析 如 何 选择 接收 器 夹 角 以 及 哪些 区 域 受 到 的 影响 比较 大 。 
各 解析 : 
-组 选取 不 同 的 接收 器 夹 角 对 Shepp-Logan 头 部 模型 图 进行 重建 的 结果 如 图 解 6-12(1) 
所 示 ,其 中 图 解 6-12(1a) 的 夹 角 为 5"、 图 解 6-12(1b) 的 夹 角 为 2 、 图 解 6-12(1c) 的 夹 角 为 1、 
图 解 6-12(1d) 的 夹 角 为 0.5°、 图 解 6-12(1e) 的 夹 角 为 0.1 图解 6-12(1f) 的 夹 角 为 0.05°。 


回国 区 
回回 回 


(d) 








图 解 6-12(1) 不 同 夹 角 下 的 重建 图 
与 上 述 重 建 结 果 对 应 的 误差 图 ( 原 图 像 与 重建 图 的 差 ) 如 图 解 6-12(2) 所 示 。 


(b) (©) 
©) (D 


EE 图 解 6-12(2) ”误差 图 











由 重建 结果 可 见 , 当 接收 器 之 间 的 夹 角 小 于 工时 才能 得 到 比较 好 的 重建 质量 ,但 夹 角 
小 于 0.5° 后 ,质量 改进 的 幅度 不 太 大 。 由 误差 图 可 见 , 重 建 误差 主要 出 现在 各 个 区 域 轮廓 
处 ,区 域内 部 的 重建 误差 比较 小 。 


6-13 ”代数 重建 技术 的 迭代 计算 














名 题 面 : 

给 定 原始 (未 知 ) 图 像 如 图 题 6-13 所 示 。 

现 考虑 借助 沿 与 水 平方 向 为 0 、45"、90"、135" 的 4 个 方向 的 投影 ， 
利用 代数 重建 技术 来 进行 重建 。 给 出 前 3 次 迭代 的 结果 。 

名 解析 : 

前 3 次 迭代 重建 的 结果 图 像 依 次 如 图 解 6-13(a) 、 图 解 6-13(b) 、 
图 解 6-13(c) 所 示 。 和 迭代 3 次 后 已 经 与 原始 图 像 相当 接近 了 ,最 大 绝 “图 题 6-13 原始 图 像 
对 误差 小 于 0. 03。 



































(b) 
图 解 6-13 前 3 次 迭代 重建 图 像 


6-14 ”最 大 似 然 - 最 大 期 望 重 建 算法 的 迭代 计算 


如题 面 : 

最 大 似 然 -最 大 期 望 重 建 算法 中 的 一 次 迭代 的 5 个 步骤 可 以 写 为 : 

(1) 计算 当前 图 像 的 投影 。 

(2) 计算 给 定 的 测量 值 与 当前 图 像 的 投影 数据 的 比值 。 

(3) 对 比值 进行 逆 投 影 。 

(4) 将 步骤 (3) 所 得 图 像 的 每 个 像素 除 以 N ,这 里 N 是 图 像 单方 向 的 维 数 ( 设 为 正方 形 
图 像 ) 。 

(5) 用 步骤 (4) 的 结果 与 当前 图 像 对 应 像素 相 乘 ( 相 当 于 数组 相 乘 而 不 是 矩阵 相 乘 ) 。 

现 设 对 一 幅 2X2 的 图 像 所 获得 的 投影 结果 (测量 值 ) 如 下 ( 先 令 图 像 中 像素 迭代 初 值 均 
为 1): 


[二 二 | 
[1 1|3 


给 出 采用 最 大 似 然 -最 大 期 望 重 建 算法 进行 前 3 次 迭代 的 步骤 (计算 中 保留 两 位 小 数 ) 。 
。69 。 


气 解 析 : 
前 3 次 欠 代 的 各 个 步骤 列 在 表 解 6-14 中 。 迭 代 结 果 逐 次 接近 测量 值 。 


表 解 6-14 前 3 次 选 代 的 各 个 步骤 


















































































































































第 一 次 迭代 第 二 次 和 迭代 第 三 次 迭代 
到 2 下 沁 届 1.28 2.74 
0) [1 |] 0.5 1.0| 1.5 0.34 0.94| 1.28 
Ii 立 | 沟 1.0 1.5| 2.5 0.94 1.80| 2.74 
02) /22=0.51.5) 1 3)/01.5 2.5) 一 (0.671.20) (1 3)/(1.28 2.74) 一 (0.78 1.09) 
(13)/(2 2)=(0.5 1.5) (1 3)/G.5 2.5)=(0. 67 1.20) (1 3)/(1. 28 2.74) 一 (0.78 1.09) 
0.5 1.5 0.67 1.20 0.78 1.09 
C3) [1 2| 0.5 1.34 1.87| 0.67 1.56 1.87| 0.78 
[z 3| is 1.87 2.40| 1.20 1.87 2.18| 1.09 
[1 21/[2 2| fos 1olli.34 1.87| /2 2| [0.67 0.94|l1.s6 1.87| /|2 2| |o.78 0.94 
(4) El! | / a 
[2 3)/|z ?| 15|D.s7 2.40]/|2 2| [os4 1.20lli.87 2.18|/ [2 2| lo.94 1.09 
[1 1| 0s 1.0 0.5 1.0| fo.67 ‘0.94 0.34 0.94| [0.78 ‘0.94 
XxX, Xx 
[i | lo ss 1.0 1.5| |0.94 1.20 0.94 1.80| |o.94 1.09 
(5) 
0.5 1.0 0.34 0.94 0.27 0.88 
让 0.94 1.80 0.88 1.96 
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图 像 编码 是 图 像 处 理 中 的 一 大 类 技术 。 图 像 处 理 的 目的 除了 改善 图 像 的 视觉 效果 之 
外 ,还 有 在 保证 一 定 视觉 质量 的 前 提 下 减少 数据 量 ( 从 而 也 减少 图 像 存储 所 需要 的 空间 和 传 
输 所 需要 的 时 间 ) 的 结果 ,即使 用 较 少 的 数据 量 来 获得 较 好 的 视觉 效果 。 

图 像 的 视觉 质量 与 表达 图 像 的 数据 量 是 相关 但 又 不 同 的 量 。 或 者 说 ,数据 和 信息 不 是 
等 同 的 概念 。 数 据 是 信息 的 载体 ,对 给 定量 的 信息 可 以 用 不 同 的 数据 量 来 表示 。 采 用 能 减 
少 表示 一 幅 图 像 所 需要 数据 量 的 图 像 表达 方法 就 是 图 像 编码 要 解决 的 主要 问题 。 

图 像 编 码 也 称 图 像 压 缩 , 对 给 定量 的 信息 ,图 像 压缩 指 设法 减少 表达 图 像 信息 所 需 的 数 
据 量 。 图 像 之 所 以 能 被 压缩 ,是 由 于 原始 图 像 的 表达 中 有 多 种 形式 的 数据 元 余 , 包 括 心理 视 
觉 宛 余 、 像 素 间 元 余 和 编码 宛 余 。 如 果 能 消除 或 减少 一 种 或 多 种 元 余 , 就 可 取得 数据 压缩 的 
效果 。 

图 像 编 码 以 信息 论 为 基础 ,以 改变 表达 方法 为 主要 手段 。 需 要 注意 ,编码 压缩 后 的 输出 
结果 常常 不 再 是 图 像 形式 ,此 时 直接 显示 会 没有 意义 或 不 能 反映 图 像 的 全 部 性 质 和 内 容 , 所 
以 编码 后 如 果 要 使 用 图 像 还 常常 需要 将 编码 结果 转换 回 图 像 形式 ,这 就 是 图 像 解码 ,也 被 称 
为 图 像 解 压缩 。 图 像 压缩 和 图 像 解 压缩 都 是 图 像 编 码 要 研究 的 问题 。 

图 像 编 码 的 方法 很 多 ,可 以 在 图 像 域 直 接 进 行 ,又 包括 将 图 像 转化 为 二 值 图 的 位 平面 编 
码 法 和 按 灰 度 图 进行 的 变 长 编码 法 (如 哥伦布 编码 . 哈 夫 曼 编码 、 香 农 -法 诺 编码 和 算术 编 
码 ) 。 图 像 编 码 也 可 在 变换 域 进行 ,典型 的 方法 基于 离散 余弦 变换 和 离散 小 波 变换 ,实现 在 
变换 域 进行 压缩 。 图 像 编 码 的 方法 常常 要 根据 图 像 的 特性 和 应 用 要 求 来 选择 ,典型 的 方法 
如 基于 符号 的 编码 .LZW 编码 ` 预 测 编码 . 子 带 编码 .矢量 量化 编码 等 都 各 有 特点 。 图 像 纺 
码 的 新 方法 还 在 不 断 发 展 中 ,如 准 无 损 编码 、 分 形 编码 ` 基 于 内 容 的 编码 等 。 

本 章 的 问题 涉及 上 述 图 像 编码 多 个 方面 的 概念 。 


7-1 符号 与 符号 串 的 概率 








名 题 面 : 

设 有 两 个 符号 ,ai 的 出 现 概率 为 0.8,as 的 出 现 概率 为 0.2, 平 均 概 率 为 0.5。 其 绝对 差 
( 即 各 概率 相对 于 平均 值 的 偏差 ) 之 和 为 10. 8 一 0.5| 十 10.2 一 0.5| 二 0.6。 对 单个 符号 用 自 
然 码 或 哈 夫 曼 编码 所 得 到 的 平均 码 长 均 为 1bit/symbol。 

(1) 给 出 双 符 号 串 的 概率 ,计算 用 哈 夫 曼 码 字 表达 时 的 平均 码 长 。 

(2) 给 出 三 符号 串 的 概率 ,计算 用 哈 夫 曼 码 字 表 达 时 的 平均 码 长 。 

(3) 比较 计算 结果 ,可 得 到 什么 推论 ? 


殷 解 析 : 


(1) 双 符 号 串 共 有 4 种 形式 ,它们 的 概率 如 表 解 7-1(1) 所 示 。 因 为 平均 概率 为 0.25, 所 以 





绝对 差 之 和 为 |0. 64 一 0. 25| 十 10. 16 一 0. 25| 十 |0.16 一 0.25| 十 10.04 一 0. 25| 王 0.78。 这 些 双 
符号 串 的 喻 夫 曼 码 字 也 列 在 表 解 7-1(1) 中 ,其 平均 码 长 为 1. 56bit/string 二 0.78bit/symbol。 





表 解 7-1(1) 双 符 号 串 的 概率 和 哈 夫 曼 码 字 

















符 号 串 概 率 哈 夫 曼 码 字 
aaal 0.8X 0. 8 一 0. 64 0 
Qiaz 0.8X 0.2=0.16 11 
azal 0.2X 0.8=0.16 100 
azas 0.2X 0.2=0.04 101 





(2) 三 符号 串 共有 8 种 形式 ,它们 的 概率 如 表 解 7-1(2) 所 示 。 因 为 平均 概率 为 0. 125， 
所 以 绝对 差 之 和 为 10. 512 一 0.125| 十 3X10.128 一 0.125| 十 3X10.032 一 0.125| 十 10. 008 
0.125| 二 0.792。 这 些 三 符号 串 的 哈 夫 曼 码 字 也 列 在 表 解 7-1(2) 中 ,其 平均 码 长 为 
2. 184bit/string=0.728bit/symbol,。 





表 解 7-1(2) 三 符号 串 的 概率 和 哈 夫 曼 码 字 


























符 号 串 概 率 哈 夫 曼 码 字 
aaial 0.8X 0.8X0.8=0. 512 0 
analay 0.8X 0.8X0.2 一 0.128 100 
aiasa1 0. 8X 0.2X0.8=0.128 101 
asaiai 0.2X 0.8X0.8=0.128 110 
alazas 0.8X 0.2X0.2 一 0.032 11100 
azala? 0.2X 0.8X0.2 一 0.032 11101 
azazal 0.2X 0.2X0.8 一 0.032 11110 
azazaz 0.2X 0.2X0.2 一 0.008 11111 








(3) 比较 不 同 长 度 符号 串 的 概率 ,可 知 随 着 符号 串 长 度 的 增加 ,同一 种 长 度 符号 串 的 概 
率 与 其 平均 值 的 绝对 差 之 和 也 会 增加 。 这 说 明 对 较 长 的 符号 串 更 有 可 能 通过 变 长 编码 来 减 


少 平均 比特 率 。 


比较 对 不 同 长 度 符号 串 进 行 哈 夫 曼 编码 得 到 的 码 字 ,可知 随 着 符号 串 长 度 的 增加 ,编码 
码 字 的 平均 码 长 是 减少 的 。 这 说 明 对 较 长 的 符号 串 进行 编码 能 得 到 更 好 的 压缩 效果 。 


名 题 面 : 


给 定 如 图 题 7-2 所 示 的 图 像 , 试 分 别 进行 一 阶 编码 和 二 阶 编码 。 


气 解 析 


7-2 一 阶 和 二 阶 编码 


在 该 图 像 中 ,0 的 出 现 概率 为 0.8,255 的 出 现 概率 为 0.2。 进 行 一 阶 编 码 时 , 信 源 


炉 为 


“ Ts 


2 
H(W = 一 >)P(w) logs[LP(a)] 


一 一 0. 8 log:(0.8) — 0. 2 log; (0. 2) 
=0D 并 区 
对 单个 符号 的 符号 串 用 哈 夫 曼 编码 得 到 的 平均 码 长 为 
1bit/symbol, 效 率 为 72. 19%。 
进行 二 阶 编码 时 ,认为 像素 从 左 向 右 , 从 上 向 下 循环 排列 。 这 
样 得 到 的 双 符 号 串 共有 3 种 形式 ,对 它们 用 哈 夫 曼 编码 得 到 的 结 
果 如 表 解 7-2 所 示 。 





























图 解 7-2 实验 图 像 


表 解 7-2 二 阶 编码 的 结果 























符 号 串 概 率 哈 夫 曼 码 字 字 长 
0-0 0.6 0 
0-255 0.2 10 2 
255-0 0.2 11 

此 时 信 源 焙 为 : 


4 
H(u) = 一 >)P(w) logsLP(a;)] =— 2 X 0.2 log:(0.2)—0.6 1ogs(0.6) = 1.371 


j=1 
用 哈 夫 曼 编 码 得 到 的 平均 码 长 为 0.6X1 十 2X (0.2X2)=1. 4bit/symbol。 
此 时 效率 为 97.93%, 比 一 阶 编 码 有 较 大 提高 。 


7-3 ”编码 图 信 品 比 的 计算 


各 题 面 : 
设 图 题 7-3 中 各 对 图 的 左 图 为 编码 输入 图 , 右 图 为 解码 输出 图 。 试 计算 它们 输出 图 的 
各 种 信 噪 比 指标 : SNR。,、SNRs、SNR 和 PSNR。 


1 1 于 温 
水源 章 有 过 洒 
: Ft 


本 解析 : 
从 左 到 右 ,各 输出 图 的 SNR。。SNR,。。 SNR 和 PSNR 分 别 为 : 
SNR。. = 20, SNR。. = 4.472, SNR = 8.451dB 
SNR。 = 24, SNR。. = 4.899, SNR = 7.782dB 
SNR。. = 29, SNR。. = 5.385, SNR = 9.091dB 
SNR。 = 36, SNR.,, = 6.010, SNR = 9.031dB 





(一 一 
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图 题 7-3 ”编码 输入 图 和 解码 输出 图 


PSNR = 17. 413dB 
PSNR = 18.573dB 
PSNR = 18. 573dB 
PSNR = 19.596dB 


EE 


7-4 二 值 码 和 灰 度 码 


如题 面 : 

(1) 构造 完整 的 4 比特 灰 度 码 。 

(2) 设计 一 种 通用 的 方法 将 灰 度 码 转换 成 二 值 码 ( 自 然 码 ), 并 用 于 转换 灰 度 
码 011010100111。 

如 解析 : 

(1) 所 构造 的 4 比特 灰 度 码 和 对 应 的 4 比特 二 值 码 如 表 解 7-4 所 示 。 


表 解 7-4 二 值 码 和 灰 度 码 
4 比特 
二 值 码 
4 比特 
灰 度 码 


0000 0001 0010 0011 0100 0101 0110 0111 1000 1001 1010 1011 1100 1101 1110 1111 





0000 0001 0011 0010 0110 0111 0101 0100 1100 1101 1111 1110 1010 1011 1001 1000 


(2) 从 灰 度 码 gsgsgigo 到 对 应 的 二 值 码 asasaiao 的 转换 为 
Q3 一 gs3 
Q2 一 83 Og: 
al 一 〈8s 由 8) Da 
ao 一 [(gs Dg)DalDeg 
据 此 ,对 灰 度 码 011010100111 进行 转换 得 到 二 值 码 010011000101 。 


7-5 二 值 分 解 和 灰 度 码 分 解 


各 题 面 : 

二 值 分 解 和 灰 度 码 分 解 都 是 基本 的 将 图 像 分 解 为 位 平面 的 方法 。 考 虑 图 像 有 4 个 位 
面 ,那么 

(1) 二 值 分 解 所 得 到 的 二 值 码 在 相 邻 码 之 间 最 多 可 有 几 位 不 同 ? 

(2) 灰 度 码 分 解 所 得 到 的 灰 度 码 在 相 邻 码 之 间 最 多 可 有 几 位 不 同 ? 

忌 解 析 : 

(1) 二 值 码 在 相 邻 码 之 间 最 多 可 有 4 位 不 同 , 如 从 7(0111) 到 8(1000) ,如 图 解 7-5(1) 所 示 。 


01234556 7 $8 9 1011 12 13 14 15 








wb 一 





图 解 7-5(1) 4 比特 二 值 码 











(2) 灰 度 码 在 相 邻 码 之 间 最 多 只 有 一 位 不 同 . 如 从 7(0100) 到 8(1100) ,如 图 解 7-5(2) 所 示 。 


和 


9 13 2 直下 














图 解 7-5(2) 4 比特 灰 度 码 








7-6 1-D 游程 和 WBS 编码 方法 


各 题 面 : 

设 有 一 幅 图 像 某 一 位 面 某 一 行 的 值 为 11111011100001111000, 分 别 采用 1-D 游程 编码 
和 跳跃 白色 块 (WBS) 编 码 方法 对 这 个 序列 进行 编码 ,并 对 两 者 所 需 的 比特 数 进行 比较 。 

雪 解 析 : 

原来 的 序列 需 用 20 个 比特 来 表示 。 

先 考虑 1-D 游程 编码 方法 。 该 序列 可 编 为 6 个 游程 ( 先 1 后 0):513443, 其 中 有 
4 个 不 同 的 符号 。 对 其 进行 哈 夫 曼 编码 ,得 到 (符号 : 码 字 ): (4: 0); (3: 10); (5: 110); 
(1: 111)。 这 样 得 到 的 编码 结果 为 110 111 10 0 0 10, 使 用 了 12 个 比特 。 如 果 不 进行 哈 夫 
曼 编码 ,只 使 用 自然 码 来 编码 这 4 个 符号 , 则 需要 18 个 比特 。 

再 考虑 WBS 编码 方法 。 如 果 选 择 使 用 0 表示 不 同 长 度 (1 Xn) 的 值 为 1 的 区 域 ,而 使 用 
1 后 面 接 位 模式 表示 同样 长 度 (1 Xn) 的 其 他 区 域 , 则 会 得 到 如 下 不 同 的 编码 结果 。 

(1) 长 度 为 1X2, 编 码 输 出 为 00 110 0 110 100 101 0 110 100, 共 需要 使 用 22 个 比特 。 

(2) 长 度 为 1X3, 编 码 输 出 为 0 1110 0 1000 1011 1110 100, 共 需要 使 用 21 个 比特 。 

(3) 长 度 为 1X4, 编 码 输出 为 0 11011 11000 10111 11000, 共 需要 使 用 21 个 比特 。 

(4) 长 度 为 1X5, 编 码 输出 为 0 101110 100011 111000, 共 需要 使 用 19 个 比特 。 

对 这 里 的 数据 ,采用 1-D 游程 编码 的 效果 要 优 于 采用 WBS 编码 的 效果 。 


7-7 对 英文 字母 的 哈 夫 曼 编 码 





各 题 面 : 
对 26 个 英文 字母 出 现 概率 的 一 个 统计 见 表 题 7-7, 试 据 此 对 它们 进行 哈 夫 曼 编 码 。 
表 题 7-7 26 个 英文 字母 的 出 现 概率 
字母 A B C D E F & H I 





概率 0.080 0.015 0.030 0.040 0.130 0.020 0.015 0.060 0.065 








字母 J K L M N O 因 Q 及 





概率 0. 005 0.005 0.035 0.030 0.070 0.080 0.020 0.0025 0.065 








字母 矶 全 U V Ww 香 Y Z 
































概率 0. 060 0. 090 0. 030 0.010 0.015 0.005 0.020 0.0025 
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总 解 析 : 
对 26 个 英文 字母 的 哈 夫 曼 编码 结果 见 表 解 7-7。 


表 解 7-7 对 26 个 英文 字母 的 哈 夫 曼 编码 结果 


















































字母 A B © D E F G H I 
码 字 0011 11010 | 10100 | 10010 000 10111 | 11100 | 10000 0111 
字母 K L M N 0 P Q R 
码 字 | 111100 | 111101 | 10011 | 10110 0101 0100 11000 | 1111110 | 0110 
字母 S 至 U V W 发 区 妥 
码 字 10001 0010 10101 | 11101 | 11011 | 111110 | 11001 | 1111111 
» 
7-8” 哈 夫 晕 编码 和 平移 哈 夫 曼 编 码 
如题 面 : 


给 定 一 个 信 源 符号 集 A= {ail, azs, a3, a4， 


0 120. 22'0: 13051 OL 0150.07] ， 
(1) 给 出 用 哈 夫 曼 编 码 得 到 的 码 本 。 
(2) 给 出 用 平移 哈 夫 曼 编 码 ( 将 信 源 符号 分 成 两 组 ) 得 到 的 码 本 。 


(3) 分 别 计算 两 种 码 本 的 效率 (用 % 表 示 ) ,并 比较 讨论 。 


ads» de» U7» 


as), 且 已 知 对 应 的 w=[0. 10 


(4) 如 果 信 源 输 出 符号 序列 {a;， as，as，as) ,用 两 种 码 本 得 到 的 结果 各 是 什么 ? 




































































如 解析 : 
(1) 哈 夫 曼 编码 过 程 如 表 解 7-8(1) 所 示 。 
表 解 7-8(1) ” 哈 夫 曼 编 码 过 程 

初始 信 源 对 消减 信 源 的 赋值 
符号 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 
as 0.22 10 0.22 10 0.22 10 0.25 01 0. 32 00 0.43 1 0.57 0 
ar 15| 10l IO | 100 |'0.21 ll 0.22 10 0.25 01 0.32 00 0. 43 1 
a 和 区 | 0 | | WL 0 和 | 00 |V21 1 0.22 10 0. 25 01 

Q2 0.12| 011 |0:13| 010 |'0;15| 101 |0.17 | 100 |70.21 

as 和 天 | 1 |0 WW | WL 0 二 | V0 | Wl 

al Bn Mb | | WI 

as 0.10 | 1000 | 0.10 | 111 

as 0.07 | 1001 

所 以 编码 结果 如 表 解 7-8(2) (注意 并 不 唯一 ,因为 编码 过 程 中 每 次 取 0 或 取 1 可 以 是 
随机 的 ,但 码 字 的 长 度 是 唯一 的 ) 所 示 。 
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表 解 7-8(2) ” 哈 夫 曼 编 码 结果 








符号 QI Q2 Q3 as as as ar as 
概率 0.10 0.12 0.22 0.13 0.10 0.11 0.15 0.07 
码 字 111 011 10 010 1001 110 101 1001 























(2) 平移 哈 夫 曼 编码 过 程 如 表 解 7-8(3) (将 出 现 概率 最 小 的 as ,ai ,as 和 as 合并 成 为 
az， 然后 与 a3 ,ar ,a4 ,az 联合 进行 哈 夫 曼 编 码 ) 所 示 。 


表 解 7-8(3) 平移 哈 夫 曼 编 码 过 程 




















符号 概率 码 字 概率 码 字 概率 码 字 概率 码 字 
az 0.38 1 0.38 1 0.38 1 0.62 0 
as 0.22 000 0 01 0.37 00 0.38 1 
ar 0.15 001 0.22 000 0.25 01 
a 0.13 0000 0.15 001 
a 0.12 0001 


























取 az 的 码 字 为 移 上 前 组 符号 , 则 对 as ,ayas 和 as 的 编码 结果 如 表 解 7-8(4) 所 示 。 
表 解 7-8(4) ax 中 符号 的 编码 结果 














符 ”号 概 率 码 字 
as 0.11 1000 
aa 0. 10 1001 
as 0.10 1010 
as 0.07 1011 








将 上 面 的 结果 合并 起 来 得 到 相应 的 码 字 如 表 解 7-8(5)( 注 意 并 不 唯一 ,因为 编码 过 程 
中 取 0 或 取 1 都 是 随机 的 , 且 a 和 as 的 结果 可 以 互 换 ) 所 示 。 


表 解 7-8(5) 平移 哈 夫 曼 编码 结果 








符号 a az as a as as ar as 
概率 0. 10 0. 12 0. 22 0. 13 0. 10 0. 11 0.15 0.07 
码 字 1001 011 000 010 1010 1000 001 1011 


























(3) 原 信 源 的 焙 为 : 
8 

H(wW)=— >)P(w)logz[P(w)] 
j=1 


=— {0. llog: (0. 1) 十 0. 12log: (0. 12) + 0. 22log; (0. 22) 十 0. 13logs(0. 13) 十 
0. llog: (0. 1) 十 0. 11log: (0. 11) +0.15log:(0.15) + 0.07log: (0.07)] 
= 2. 9241 
喻 夫 曼 编码 得 到 的 平均 码 长 和 效率 分 别 为 : 


8 
Li = DP) = 0.1X3+0.12X3++0.22X2++0.13X3 十 


j=1 
0.1 关 4 十 0.11X 关 3 十 0.15 广 3 十 0.07 又 本 一 2.95 
wv 


_ HQ(w) _ 2.9241 
Es 2.95 


平移 哈 夫 曼 编 码 得 到 的 平均 码 长 和 效率 分 别 为 : 


8 
L,= > Pte) 0.1X4 十 0.12X3 十 0.22X3 十 0.13X3 十 0.1 X41+ 


j=1 


= 99.12% 














0.11X4 十 0.15X3 十 0.07X4 王 3.38 


_ H(w _ 2.9241 
LL 3.38 


由 以 上 结果 可 以 看 出 ,对 于 该 信 源 哈 夫 曼 编码 的 编码 效率 远 好 于 平移 喻 夫 曼 编码 的 编 
码 效率 ,但 是 平移 哈 夫 曼 编码 相对 来 说 比较 容易 实现 。 

(4) 用 哈 夫 曼 编码 的 码 本 得 到 的 结果 是 : 100101001110。 用 平移 喻 夫 曼 编码 的 码 本 得 
到 的 结果 是 : 00001010101000。 这 比 哈 夫 曼 编码 的 码 长 要 长 。 


7-9” 哈 夫 曼 编码 和 截断 哈 夫 曼 编 码 


= 86.51% 





气 题 面 : 
给 定 信 源 符号 集 A={al, azs, ass ars ass as， ar，as), 且 已 知 w 一 [0.15 0. 10 0. 25 
0. L300 Uer0I 0 1110060; 

(1) 给 出 用 哈 夫 曼 编 码 得 到 的 码 本 。 

(2) 给 出 用 截断 哈 夫 曼 编 码 (对 最 可 能 出 现 的 4 个 符号 进行 哈 夫 曼 编码 ) 得 到 的 码 本 。 

(3) 分 别 计算 两 种 码 本 的 效率 (用 % 表 示 ) ,并 比较 讨论 。 

(4) 如 果 信 源 输出 符号 序列 {a ,as ， ai， as} ,用 两 种 码 本 得 到 的 结果 各 是 什么 ? 

可 解析 : 

(1) 了 哈 夫 曼 编码 过 程 如 表 解 7-9(1) 所 示 。 

表 解 7-9(1) ” 哈 夫 曼 编 码 过 程 

初始 信 源 对 消减 信 源 的 赋值 
符号 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 | 概率 | 码 字 
as 0.25 10 0.25 10 0.25 0 |0.25 01 0. 29 00 0. 46 1 0.54 0 
Qi 0.15 | 000 | 0.15 | 000 | 0.21 11 0.25 10 0.25 01 0.29 00 0.46 1 
a 0.13 | 010 |0.14 | 001 | 0.15 | 000 | 0.21 2 0.25 10 0.25 01 
as 0.12 | 011 |0.13 | 010 | 0.14 | 001 | 0.15 | 000 | 0.21 1 
ar 0.11 | 110 |0.12 | 011 |0.13 | 010 |0.14 | 001 
as OE 3 0 | 0 [O12 | Od 
as 0.08 | 0010 | 0.10 | 111 
as 0.06 | 0011 







































































所 以 编码 结果 如 表 解 7-9(2) (注意 并 不 唯一 ,因为 编码 过 程 中 取 0 或 取 1 都 是 随机 的 ， 
但 码 字 的 长 度 是 唯一 的 ) 所 示 。 
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表 解 7-9(2) 哈 夫 曼 编 码 结果 


























符号 aa aa2 as as as as ar as 
概率 0.15 0. 10 0.25 0.13 0.08 0.12 0.11 0.06 
码 字 000 111 10 010 0010 011 110 0011 











(2) 截断 哈 夫 曼 编码 过 程 如 表 解 7-9(3)( 将 出 现 概 率 最 小 的 w ,az ,as 和 as 合并 成 为 
az 然后 与 a; ,al ,ai as 联合 进行 哈 夫 曼 编码 ) 所 示 。 


表 解 7-9(3) ”截断 哈 夫 曼 编码 过 程 

















符号 概率 码 字 概率 码 字 概率 码 字 概率 码 字 
ar 0.35 00 0.35 00 0.40 1 0.60 0 
as 0.25 01 0.25 01 0.35 00 0. 40 1 
a 0.15 11 0.25 10 0.25 01 
a 0.13 100 0.15 下 
as 0.12 101 



































将 a 的 码 字 作为 前 级 加 在 用 自然 码 编 的 a6,al,as 和 as 前 面 ,得 到 结果 码 字 如 
表 解 7-9(4) 所 示 。 


表 解 7-9(4) ”截断 哈 夫 曼 编码 结果 




















符号 a az as a as as ar as 
概率 0.15 0.10 0.25 0.13 0.08 0.12 0.11 0.06 
码 字 11 1001 01 100 1010 101 1000 1011 














(3) 原 信 源 的 和 为 : 


8 
HG(W)=— >) Pla)logsLP(a)] 


二 1 


一 一 {0. 15log; (0. 15) 十 0. 10log:(0. 10) 十 0. 25log:(0. 25) 十 0. 13log: (0. 13) 十 
0.08log: (0.08) 十 0. 12log: (0. 12) 十 0. 11log:(0. 11) 十 0. 06log*(0.06)] 
一 2.878 
哈 夫 曼 编码 的 平均 码 长 和 效率 分 别 为 : 








8 
有 一 >)0P(w) 一 0.15X3 十 0.1X3 十 0.25X2 十 0.13X3 十 0.08X41+ 
j=1 


0.12X3 十 0.11X3 十 0.06 X4 一 2.89 
_ H(uw) _ 2.878 


Ls 2.89 
截断 哈 夫 曼 编码 的 平均 码 长 和 效率 分 别 为 : 


一 99.60% 





8 
L, 一 DWPla) = 0.15X2+0.1X4+0.25X2 十 0.13X3 十 0.08X4 十 


i=1 





0.12X3 十 0.11X4 十 0.06 久 4 三 2.95 
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_ Co _ 2.878 _ 
Va i 60% 


由 以 上 结果 可 以 看 出 , 哈 夫 曼 编码 的 编码 效率 较 高 ,但 计算 量 较 大 ; 截断 哈 夫 曼 编码 通 
过 牺牲 编码 效率 使 计算 更 简便 。 

(4) 用 哈 夫 曼 编码 得 到 的 结果 是 : 111100100010。 用 截断 哈 夫 曼 编码 得 到 的 结果 是 
1001011001010。 这 上 比 哈 夫 曼 编码 的 码 长 要 长 。 


7-10 ”算术 编码 过 程 





如 题 面 : 
给 定 信 源 符号 集 A={ai, as, as, ai, as}, 且 已 知 wx 一 [0.20.3 0.10.20.2]7。 对 序列 
azasaiali 的 算术 编码 结果 是 什么 ( 画 出 编码 过 程 示意 图 )? 























所 解析 : 
算术 编码 的 过 程 如 图 解 7-10 所 示 。 
a a as al 
1 0.5 0.38 0.374 
as Ls 
4 
as | = ks 
CD 
| | 0.3692 
一 一 0.369 
a 
0 02 0.35 0.368 


图 解 7-10 算术 编码 过 程 和 结果 
编码 结果 是 在 0.368 和 0. 3692 之 间 的 一 个 实数 ,可 取 0. 369。 


7-11 算术 编码 可 编 序 列 长 度 


各 题 面 : 

已 知 在 一 段 文 本 中 ,符号 a,b,c,d,e 的 出 现 概率 分 别 是 0.2,0.15,0.25,0.3,0.1, 给 出 
对 符号 序列 bacddaecda 进行 算术 编码 得 到 的 结果 (转化 为 二 进 制 数 )。 如 果 设 算术 操作 的 
精度 为 32 比特 ,那么 算术 编码 所 可 编 的 符号 序列 的 最 大 长 度 是 多 少 ? 

各 解析 : 

最 终 的 编码 结果 在 [0. 21647825000000, 0. 21647845250000) 范 围 内 ,转换 为 长 度 最 
短 的 二 进 制 数 为 : 0011011101101011001, 共 19 位 。 当 符号 序列 全 部 由 e 构 成 时 所 需 的 
码 长 最 长 ,因为 2 2 一 2.328306436538696e ,P(e) 二 0.1, 可 编 的 符号 序列 的 最 大 长 度 
为 9。 
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各 题 面 : 


7-12 LZW 编码 


15 


对 如 图 题 7-12 所 示 的 一 幅 4X4 的 图 像 列 表 给 出 LZW 编码 的 步 15 


又 和 结果 。 
气 解 析 : 


编码 的 步骤 和 结果 见 表 解 7-12。 


表 解 7-12 LZW 编码 的 步骤 和 结果 


1s 
15 


15 27 27 
15 39 39 
过 39 
is 加 怒 


图 题 7-12 实验 图 像 







































































步骤 编码 输入 | 识别 序列 拼接 序列 编码 输出 | 字典 位 置 | 字典 条 目 
是 15 一 
2 15 15 15-15(—}) 15 256 15-15 
3 27 15 15-27(—) 15 257 15-27 
4 27 27 27-27( 一 ) 27 258 27-27 
5 15 27 27-15( 一 ) 27 259 27-15 
6 15 15 15-15( 十 》 一 
人 39 15-15 15-15-39( 一 ) 256 260 15-15-39 
8 39 39 39-39(—) 39 261 39-39 
9 15 39 39-15( 一 ) 39 262 39-15 
10 5 15 15-15( 十 》 一 
1 39 15-15 15-15-39( 十 ) 一 
2 39 15-15-39 15-15-39-39(—》 260 263 15-15-39-39 
13 15 39 39-15( 十 ) 一 
14 15 39-15 39-15-15(—) 262 264 39-15-15 
15 39 5 15-39( 一 ) 5 265 15-39 
16 39 39 39-39( 十 ) 一 一 一 
17 一 39-39 39-39( 十 ) 261 
编码 的 结果 序列 为 : {15,15,27,27,256,39,39,260,262,15,261)。 
7-13 ”分 区 模板 编码 
各 题 面 : 


对 如 图 题 7-13 所 示 的 8X8 的 图 像 计 算 其 DCT 系数 ,分 别 保留 如 下 最 大 个 系数 的 模板 
进行 分 区 编码 ,给 出 分 区 模板 图 并 计算 重建 误差 : 


(1) 6 个 系数 。 
(2) 10 个 系数 。 
(3) 15 个 系数 。 
气 解 析 : 


对 所 给 图 像 进行 离散 余弦 变换 ,计算 得 到 的 频 域 图 像 (u,v) 如 图 解 7-13(1) 所 示 。 
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图 题 7-13 一 幅 8X8 的 图 像 





















































988.000 | 一 46.688 | 一 26.515 | 65.015 65.000 | 一 1.153 | 52.925 80.518 
69. 498 42.881 | 一 28.694 | 26.191 10. 442 11.163 | 一 35.868 | 一 29. 291 
一 8.033 3.751 一 73. 900 104. 317 一 74.886 52.884 38.166 一 30. 484 
10.947 | 一 11.362 76.388 | 一 59.739 | 一 21.429 56.578 | 一 51.072 56. 641 
一 30.500 18. 505 34. 939 1.034 一 4.000 一 9.365 | 一 16.908 = 
一 28. 166 7.536 21.224 | 一 11.127 | 一 5.538 | 一 12.392 | 33.286 17. 914 
34. 176 一 19.501 34.666 | 一 31.609 19.113 一 1.631 65. 400 一 39. 634 
19. 433 一 12.497 一 18. 454 23.062 一 了 .073 5.514 | 一 14.874 一 49.251 
图 解 7-13(1) 离散 余弦 变换 得 到 的 频 域 图 像 


(1) 保留 最 大 的 6 个 系数 时 的 分 区 模板 如 图 解 7-13(2) 所 示 。 
重建 图 像 如 图 解 7-13(3) 所 示 。 
重建 误差 为 : 23643。 
















































































132.980 | 122.667 85.023 | 139.715 | 147.982 | 147.883 

108.903 | 147.913 | 130.651 | 134.290 

112.2727|108.0115 130.923 | 147.754 | 101.273 | 119.934 

11ofofofofofofi 124.441 129.189 | 130.337| 73.332 | 116.949 
ofolololofololo 

oo [rh er oslo 144.045 109.585 | 110.733 | 65.211 | 125.069 

oon oy 146.881 96314 | 113.145 | 86.938 | 134.268 
ofololololololo 

oflololololololo 126.419 | 117.431 102.019 | 141.029 | 127.799 | 137.141 
ofolololoflololo 

lio loal ma oo [ee oalo 114.363 | 169.055 | 160.135 | 135.730 

图 解 7-13(2) 保留 6 个 系数 图 解 7-13(3) 保留 6 个 系数 得 到 的 重建 图 像 

时 的 分 区 模板 
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(2) 保留 最 大 的 10 个 系数 时 的 分 区 模板 如 图 解 7-13(4) 所 示 。 
重建 图 像 如 图 解 7-13(5) 所 示 。 
EE 误差 为 14896。 









165.105 | 118.568 | 122.823 | 96.418 | 163.881 | 168.960 | 148.269 





141.651 | 128.383 | 111.606 | 126.639 | 178.419 | 130.058 | 152.577 





142.560 | 90.514 | 145.903 | 133.708 | 163.309 | 125.201 | 106.920 










































































0|0|1|11|1010 142.125 | 108.344 | 121.483 | 135.720 | 149.639 | 73.095 | 119.243 

olololololo 

[oolol 156.935 | 111.671 | 108.569 | 111.322 | 125.241 | 60.181 | 122.570 

| 呈 呈 各 163.517| 91.198 | 117.917 | 85.448 | 115.050 | 97.215 | 107.604 

olololololo 

olololololo 128.105 | 110.805 | 88.324 | 99.324 | 151.104 | 106.776 | 134.999 

olololololil 

ofolololoTso 111.667 | 82.316 | 110.876 | 101.658 | 169.121 | 157.013 | 112.017 
图 解 7-13(4) 保留 10 个 系数 图 解 7-13(5) 保留 10 个 系数 得 到 的 重建 图 像 

时 的 分 区 模板 


(3) 保留 最 大 的 15 个 系数 时 的 分 区 模板 ms (u,v) 如 图 解 7-13(6) 所 示 。 
重建 图 像 如 图 解 7-13(7) 所 示 。 
重建 误差 为 : 10667。 













































































173.978 | 82.291 | 158.112 | 108.124 | 145.014 | 150.957 | 167.259 | 98.661 
148.393 115.544 | 126.061 | 171.835 | 143.407 | 145.223 | 100.807 
145.092 124.940 | 119.869 | 169.987 | 163.452 | 74.849 | 139.119 
139.917 111.532 | 118.556 | 159.642 | 100.334 | 88.160 | 166.894 
152.731 131.042 | 101.014 | 128.389 | 54.996 | 112.405 | 183.701 
162.524 154.194 | 83.712 | 109.624 | 78.226 | 112.463 | 163.601 
134.145 103.648 | 101.154 | 142.114 | 108.740 | 134.990 | 87.962 
123.527 97.640 | 103.104 | 160.515 | 187.537 | 99.700 | 42.234 

图 解 7-13(6) 保留 15 个 系数 图 解 7-13(7) 保留 15 个 系数 得 到 的 重建 图 像 

时 的 分 区 模板 


7-14 阔 值 编码 


名 题 面 : 
在 阅 值 编码 中 ,有 3 种 对 变换 子 图 像 取 阅 值 的 方法 : 


(1) 对 所 有 子 图 像 用 一 个 全 局 浆 值 。 

(2) 对 各 个 子 图 像 分 别 用 不 同 的 冰 值 。 

(3) 根据 子 图 像 中 各 系数 的 位 置 选取 阔 值 。 

实验 或 分 析 ,比较 用 3 种 方法 所 获得 的 码 率 大 小 。 

名 解析 : 

进行 了 一 组 实验 。 选 用 256 X256 像素 的 图 像 , 分 解 为 8X8 像素 的 子 图 像 , 采 用 DCT 
编码 ,8 比特 均匀 量化 ,对 0 系数 使 用 1-D 游程 编码 ,对 非 0 系数 使 用 哈 夫 曼 编码 : 

(1) 全 局 国 值 设 为 10,0 系数 编码 总 比特 数 : 1153, 非 0 系数 编码 总 比特 数 : 45814, 压 
缩 后 总 比特 数 : 46967 , 码 率 : 0.7167 ,压缩 率 ; 11. 1629 。 

(2) 每 个 子 图 像 保留 20 个 系数 (各 子 图 像 国 值 不 同 ) ,0 系数 编码 总 比特 数 : 1024( 无 游 
程 编 码 ) , 非 0 系数 编码 总 比特 数 : 85027, 压 缩 后 总 比特 数 : 86051, 码 率 : 1. 3130 ,压缩 率 : 
6.0928。 

(3) 位 置 冰 值 (模板 ) 设 为 10,0 系数 编码 总 比特 数 : 1207, 非 0 系数 编码 总 比特 数 : 
42604, 压 缩 后 总 比特 数 : 43811 , 码 率 : 0. 6685 ,压缩 率 : 11. 9670。 

根据 这 组 实验 的 码 率 判断 ,从 性 能 上 看 : 方法 (3) 二 方法 (1) 二 方法 (2) 。 


7-15 霍 特 林 变 换 与 编码 


气 题 面 : 

相 比 于 其 他 变换 , 霍 特 林 变换 的 信息 集中 能 力 最 强 。 为 什么 信息 集中 能 力 强 对 利用 变 
换 编码 的 图 像 压 缩 有 利 ? 可 为 什么 霍 特 林 变换 在 实际 中 又 没有 被 用 于 图 像 压缩 ? 

艺 解 析 

利用 变换 编码 进行 压缩 是 通过 舍弃 一 些 变换 系数 而 获得 压缩 效果 的 。 信 息 集 中 能 力 强 
可 将 更 多 的 信息 集中 到 更 少 的 变换 系数 上 ,这 样 在 舍弃 变换 系数 时 信息 损失 少 ,对 图 像 压 缩 
有 利 。 不 过 霍 特 林 变 换 与 输 和 有关, 对 每 幅 图 像 都 需要 计算 具体 的 变换 和 矩阵 ,因而 计算 量 非 
常 大 ,所 以 在 实际 图 像 压 缩 中 并 没有 得 到 应 用 。 
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图 像 处 理 技术 一 直 在 不 断 地 拓展 中 。 在 前 面 3 章 所 介绍 的 三 大 类 基本 图 像 处 理 技术 的 
基础 之 上 ,许多 新 的 理论 .新 的 方法 .新 的 手段 也 在 不 断 涌现 。 这 里 的 拓展 体现 在 多 个 方面 ， 
包括 处 理 的 目标 、 手 段 . 数 据 、 方 法 、 人 逻辑 、 思 路 等 。 另 外 ,对 这 些 拓 展 技 术 的 学 习 也 有 利于 对 
前 面 介绍 的 基本 技术 进行 综合 ,深化 对 它们 的 理解 ,并 解决 更 多 的 问题 。 

在 基本 的 2-D 图 像 表 达 f(x, y) 中 有 两 部 分 重要 内 容 : f 和 (x,y)。 对 了 的 一 种 拓展 
是 从 标量 f 到 矢量 (多 分 量 )f。 最 常见 的 就 是 彩色 图 像 f(z，y) ,这 里 了 是 个 3-D 矢量 ( 通 
常 对 应 RG、B, 但 也 可 以 是 很 多 其 他 彩色 空间 的 3 个 分 量 )。 对 (xz, y) 的 一 种 拓展 是 从 2-D 
空间 坐标 (x,y) 到 3-D 时 空 坐标 (zx, y, +t)。 最 典型 的 就 是 视频 图 像 F(z，y， ?), 它 包括 了 
2-D 的 空间 和 1-D 的 时 间 , 不 仅 反映 了 场景 中 的 景物 位 置 ,还 反映 了 它们 随时 间 变 化 的 
信息 。 

拓展 也 可 以 按 其 他 思路 进行 。 以 图 像 编码 为 例 , 图 像 编 码 是 要 在 保持 或 基本 保持 图 像 
信息 的 前 提 下 尽 可 能 地 减少 数据 量 。 反 过 来 ,在 有 些 图 像 应 用 中 ,更 希望 在 增加 较 少 数据 量 
的 情况 下 扩大 图 像 的 信息 量 。 图 像 数字 水 印 就 是 这 样 一 种 应 用 。 通 过 将 特定 的 信息 “ 编 ” 人 
图 像 数据 并 在 保证 图 像 视觉 质量 的 前 提 下 ,将 特定 信息 与 图 像 联 系 在 一 起 。 又 如 ,图 像 信息 
隐藏 也 要 把 信息 嵌入 图 像 , 用 图 像 载体 来 保护 嵌入 的 信息 。 图 像 数 字 水 印 和 图 像 信息 隐藏 
都 与 图 像 信息 安全 密切 相关 。 而 图 像 认 证 和 取证 技术 对 保障 图 像 的 真实 性 和 完整 性 也 非常 
重要 ,也 是 图 像 信息 安全 的 重要 手段 。 

利用 增加 数据 量 以 扩大 图 像 信息 量 的 还 有 多 尺度 图 像 处 理 ( 也 称 多 分 辩 率 图 像 处 理 ) 。 
多 尺度 图 像 是 对 基本 图 像 表 达 在 图 像 表 达 方 式 上 的 拓展 ,其 目标 是 要 充分 挖掘 图 像 内 部 的 
结构 信息 ,实现 在 不 同 层 次 上 的 表达 。 通 过 综合 利用 图 像 内 容 在 多 个 尺度 上 的 联系 ,有 望 得 
到 对 图 像 更 全 面 的 表达 .更 有 效 的 处 理 并 获得 更 好 的 结果 。 

很 多 拓展 处 理 技术 借鉴 了 基本 的 图 像 处 理 技术 ,但 也 有 很 多 全 新 的 拓展 处 理 技 术 。 例 
如 ,彩色 图 像 处 理 将 图 像 从 标量 图 像 拓 展 为 撩 量 图 像 . 有 些 图 像 处 理 技术 可 以 推广 到 矢量 图 
像 , 但 也 有 些 图 像 处 理 技术 无 法 直接 向 矢量 图 像 推广 ,所 以 需要 借助 新 的 技术 。 又 如 ,在 对 
视频 图 像 的 处 理 中 ,对 每 帧 图 像 的 处 理 仍 可 借助 静止 图 像 的 处 理 方法 ,但 对 运动 信息 的 检测 
和 表示 等 常常 需要 结合 视频 图 像 的 特点 进行 改进 和 扩展 。 特 别 是 在 多 尺度 图 像 处 理 中 ,对 
图 像 的 多 尺度 表达 方式 和 相应 的 金字 塔 结构 ,基于 多 尺度 表达 的 小 波 变换 处 理 技 术 ,结合 不 
同 尺 度 的 超 分 辩 率 (包括 基于 单 幅 图 像 的 超 分 辩 率 复原 以 及 基于 多 幅 图 像 的 超 分 辩 率 重建 ) 
技术 都 有 很 多 新 意 。 

本 章 的 问题 涉及 上 述 拓 展 技 术 多 个 方面 的 概念 。 





气 题 面 : 


8-1 


平均 绝对 差 和 归 一 化 互相 关 


平均 绝对 差 和 归 一 化 互相 关 是 两 个 评价 水 印 不 可 见 性 的 客观 指标 (失真 测度 )。 试 分 析 
它们 哪 一 个 更 接近 人 评价 水 印 不 可 见 性 的 主观 感受 。 


气 解析 : 





平均 绝对 差 计算 的 是 水 印 造成 的 像素 灰 度 变 化 的 绝对 值 , 而 归 一 化 互相 关 计算 的 是 水 


印 造成 的 像素 灰 度 变化 值 与 像素 原始 灰 度 值 的 比 , 即 像素 灰 度 变化 的 相对 值 。 人 类 视觉 系 
统 对 暗 光 时 亮度 的 变化 比 对 亮光 时 亮度 的 变化 更 敏感 ,所 以 主观 感受 更 接近 于 相对 灰 度 值 
的 变化 , 即 归 一 化 互相 关 计算 出 来 的 结果 。 


8-2 水 印 失真 测度 


名 题 面 : 


试 列表 给 出 平均 绝对 差 \ 均 方 误差 、L? 范 数 、 拉 普 拉 斯 均 方 误差 \ 信 了 噪 比 、 峰 值 信 噪 比 、 
归 一 化 互相 关 、 相 关 品质 、 直 方 图 相似 性 、 总 方差 信 噪 比 共 10 个 失真 测度 在 用 于 评价 数字 水 
印 时 的 优点 、 缺 点 以 及 适用 场合 。 


如 解析 : 


一 些 归纳 的 优点 、 缺 点 以 及 适用 场合 见 表 解 8-2。 


表 解 8-2 ”10 个 失真 测度 的 优点 、 缺 点 以 及 适用 场合 















































失真 测度 优点 缺点 适用 场合 
平均 绝对 差 。” | 利用 了 图 像 的 全 局 信息 计算 简便 | 没有 考虑 水 印 位 置 。 | 衡量 整体 失真 测度 
没有 考虑 水 印 位 置 计 | 对 异常 数据 差别 比较 敏 
均 方 误差 利用 了 图 像 的 全 局 信息 本 ee 
不 同 范 数 对 结果 影响 | 调整 范 数 可 用 于 各 种 
Lr? 范 数 利用 了 图 像 的 全 局 信息 Ee 2 
拉 普 拉 斯 均 方 误 . 比较 关心 区 别 水 印 嵌入 
对 像素 间 的 相对 变化 比较 敏感 | 计算 量 较 大 全 国有 
利用 了 图 像 的 全 局 信息 从 整体 
售 品 比 上 反映 了 水 印 与 原 图 像 的 能 量 | 没有 考虑 水 印 位 置 无 | 关心 图 像 能 量 的 场合 
本 法 刻画 局 部 特征 
峰值 信 噪 比 | 类 似 于 信 品 比 类 似 于 信 噪 比 类 似 于 信 品 比 
则 化 吾 相 关 | 到 看 了 人 对 图 像 的 直观 感受 体 | 与 客观 检测 结果 不 太 | 需要 考虑 嵌入 水 印 前 后 
现 了 水 印 隐藏 的 视觉 效果 一 至 的 图 像 相关 性 的 场合 
相关 品质 类 似 于 归 一 化 互相 关 类 似 于 归 一 化 互相 关 ”| 类 似 于 归 一 化 互相 关 
直方 图 相似 性 | 人 生计 上 比较 客观 地 蓝 面 了 联 入 | 不 确定 性 比较 大 计算 | 水印 对 图 像 直方 图 影响 
水 印 前 后 图 像 之 间 的 差别 量 较 大 比较 大 的 场合 
利用 了 图 像 的 全 局 信息 同时 考 | 、 图 像 局 部 变化 对 水 印 影 
总 方差 信 品 比 。| 虑 了 方差 和 信 噪 比 人 响 不 明显 的 场合 
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8-3 亚 采 样 和 剪 切 的 比较 


各 题 面 : 

假设 将 数字 水 印 嵌 入 到 图 像 DCT 变换 后 的 低频 系数 上 而 得 到 水 印 苦 入 图 像 。 将 该 图 
像 进 行 亚 采 样 和 进行 剪 切 都 可 减少 数据 量 ,在 减少 相同 数据 量 的 情况 下 , 哪 种 处 理 后 水 印 受 
到 的 影响 大 ? 

气 解 析 : 

水 印 是 嵌入 到 图 像 DCT 变换 后 的 低频 系数 上 的 。 一 方面 , 亚 采样 后 图 像 中 高 频 分 量 
受到 的 影响 大 ,而 低频 分 量 受 到 的 影响 小 ; 另 一 方面 ,进行 剪 切 后 图 像 中 高 频 和 低频 分 量 受 
到 的 影响 基本 相同 。 两 相 比较 ,图 像 剪 切 对 水 印 的 影响 相对 较 大 。 


8-4 彩色 光 的 亮度 


名 题 面 : 

在 PAL 和 NTSC 彩色 电视 制式 中 ,亮度 分 量 的 计算 公式 都 是 Y 二 0. 299R' 十 
0.587G' 十 0. 114B'。 现 设 R=R’,G=G',B=B' ,图像 用 3X8 比特 表示 。 

(1) 如 何 计算 纯 黄 光 的 亮度 值 ? 其 最 大 值 为 多 少 ? 

(2) 如 何 计算 纯 蓝 绿 光 的 亮度 值 ? 其 最 大 值 为 多 少 ? 

如 解析 : 

(1) 纯 黄 光 是 由 红色 光 和 绿色 光 生 加 而 成 的 (没有 蓝 色 光 ) ,所 以 纯 黄 光 的 最 大 亮度 为 
Y=0.299X255 十 0. 587X255 二 225. 93<z226 。 

(2) 纯 蓝 绿 光 由 绿色 光 和 蓝 色 光 全 加 而 成 的 (没有 红色 光 ), 所 以 纯 蓝 绿 光 的 最 大 亮度 
为 Y==0.587X255 十 0. 114X255 二 178.76 疙 179。 


8-5 RGB 彩色 立方 体 上 给 定 亮度 值 的 点 





各 题 面 : 

试 在 RGB 彩色 立方 体 上 标 出 所 有 亮 
度 值 为 0.5 的 点 的 位 置 。 

名 解析 : 

根据 0.5 二 (R 十 G 十 B)/3, 可 在 RGB 
彩色 立方 体 边界 上 确定 6 个 点 ,它们 的 坐 
标 分 别 为 (1, 0.5, 0),(0.5, 1, 0),(0, 1; (1,0,0.5) 
人 下 
0.5)。 所 有 亮度 值 为 0. 5 的 点 都 在 过 这 6 一 一 | 一 os 
个 点 的 平面 上 ,如 图 解 8-5 所 示 。 2 (050) 7 

图 解 8-5 RGB 彩色 立方 体 上 亮度 值 为 0.5 的 所 有 点 
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8-6 RGB 彩色 立方 体 上 给 定 饱 和 度 值 的 点 


各 题 面 : 

试 在 RGB 彩色 立方 体 上 标 出 所 有 饱和 度 值 为 1 的 点 的 位 置 。 

名 解析 : 

根据 饱和 度 计算 公式 , 当 人 饱和 度 值 为 1 时 ,3 个 分 量 RG、B 中 应 至 少 有 1 个 为 0。 所 以 
饱和 度 为 1 的 彩色 点 应 该 处 在 彩色 立方 体 上 RG、B 这 3 个 分 量 分 别 为 0 的 3 个 平面 上 , 即 
RG、GB、BR 这 3 个 平面 上 。 注 意 : R=G==B 的 点 对 应 饱和 度 值 为 0 的 点 。 


8-7 RGB 彩色 立方 体 与 HSI 颜色 实体 


蕊 题 面 : 

(1) 试 计算 RGB 彩色 立方 体 的 8 个 顶点 的 态 ,.S、IT 值 。 

(2) 在 HSI 颜色 实体 上 标 出 上 述 8 个 顶点 的 位 置 。 

要 解析 : 

(1) 对 8 个 顶点 的 电 、S、I 值 的 计算 结果 如 表 解 8-7 所 示 。 

(2) RGB 彩色 立方 体 的 8 个 顶点 在 HSI 颜色 实体 上 的 位 置 如 图 解 8-7 中 各 个 序号 点 
所 示 。 



































表 解 8-7 8 个 顶点 的 HS、I 值 7 
序号 | 顶点 坐标 H 有 I 
1 (0, 0, 0) 没 定义 0 0 
2 CL, 0% 的 0° 1 1/3 
a (1, 1, 0) 60° 和 2/3 
4 (0, 1, 0) 120° 和 1/3 
5 dD 这 240° 和 1/3 
6 da 政 300° 前 2/3 
1s 1 广 没 定义 0 1 1 
8 doy ls 这 180° 1 2/3 图 解 8-7 HSI 颜色 实体 上 的 8 个 顶点 














8-8 相 加 光 的 HSI 坐标 


各 题 面 : 

给 定 在 RGB 模型 坐标 系 中 的 两 个 点 P 和 Q, 它 们 的 坐标 分 别 为 (0.2, 0.4, 0,6) 和 
(0.3, 0.2, 0.1)。 在 HSI 模型 的 坐标 系 中 , 试 计算 W=P 十 Q 的 HSI 坐标 与 P 和 Q 的 HSI 
坐标 的 关系 。 
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忌 解 析 : 
W 点 在 RGB 坐标 系 中 位 于 (0. 5, 0. 6, 0,7)。 下 面 计算 这 3 个 点 在 HSI 坐标 系 中 
的 坐标 : 
F 二 (0.2 十 0.4 十 0.6)/3 = 0.4 








Ia = (0.3+0.2+0.1)/3 = 0.2 
Iw = (0.5 十 0.6 十 0.7)/3 = 0.6 
eee 




















Se =1—(3X0.1/(0,.3+0.2+0,1) = 0.5 
Sw 王 1 一 (3X0.5)/(0.5 十 0.6 十 0.7) = 0.167 






































4 [(0.2 一 0.4) 十 (0.2 一 0.6)]/2 E 

He = arceos {Te0. a— 0 4 C0- 206700 4 — 0.6) TT)— 193.33 
E03 = 00 D1 0 

#6 arccos { Fa 0.2)7 十 (0.3 一 0.1)(0.2 DT Et 
[(0.5 一 0.6) 十 (0.5 一 0.7)]/2 a 

Hw arccos {T0050 07 C05 — 07006 — 0.77J7) Wel OE 





由 上 可 见 ,Iw 三 1s 十 lo， 即 两 种 彩色 从 加 时 ,其 亮度 分 量 是 直接 相 加 的 ; 但 饱和 度 分 量 
和 色调 分 量 没有 这 种 关系 。 事 实 上 ,在 从 RGB 坐标 系 向 HSI 坐标 系 转换 时 ,亮度 分 量 的 公 
式 是 线性 的 ,而 色 度 分 量 ( 色 调和 人 饱和 度 ) 的 公式 是 非 线 性 的 。 


8-9 ”彩色 光 的 配色 与 混合 


名 题 面 : 
颜色 可 用 亮度 和 色 度 共同 表示 。 设 为 产生 某 种 颜色 C 所 需 的 3 个 刺激 量 分 别 用 X、Y、 
Z 表示 ,而 每 种 刺激 量 的 比例 系数 为 z+、y、<, 则 有 配色 方程 C= 二 zxX 十 yY 十 z<Z。 现 已 知 两 束 
色光 的 XYZ 坐标 分 别 为 C; (0. 3，0. 4， zi1) 和 Cs(0.1, 0.5, xz), 并且 知道 光 通 量 Y, = 
20lm,Y* 王 10lm。 
(1) 请 给 出 C! 和 C* 的 配色 方程 。 
(2) 请 给 出 C, 和 C, 混合 光 Cs 的 光 通 量 与 色 度 坐 标 ( 色 系数 ) 。 
所 解析 : 
(1) 先 计算 两 束 色光 的 色 系数 zx， 和 xz,: 
Zi = 工 一 下 意 一 静 击 0.3 
Zs 1 = 一 汤 一 于 4 一 机 名 0.4 
青 计算 两 束 色光 的 刺激 量 X 和 Xs 以 及 Z 和 2: 
Ki = riRi 2 = mi/yy = 0.3X 20/0.4 = 15 
Xz = zs (Xs 十 yz 十 Za) 一 zaYz/y = 0.1X10/0.5=2 
Zi = AKitYit+2) = aYi/y = 0.3X50= 15 
Zi = zs (Xs Yit2) = ziYs/ys = 0.4X20=8 
所 以 ,C 和 Cs 的 配色 方程 分 别 为 
Ci 一 15X 十 20Y 十 15Z 
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Cs 一 2X 十 10Y 十 8Z 
(2) 两 束 光 混合 的 光 通 量 为 两 束 光 的 光 通 量 之 和 ,所 以 混合 光 的 光 通 量 Y 三 次 十 
YY 一 30lm 。 
混合 光 Cs 的 配色 方程 为 
Cs 一 (Xi 十 Xz)X 十 (Yi 十 Yz)Y 十 (2 十 Z2)Z2 一 17X 十 30Y 十 23Z 
相应 的 色 系 数 为 
m= =H = WO= 0 三 如 /0 二 到 3 
Cs 的 色 度 坐标 为 (0. 24，0. 43，0. 33) 。 


8-10 饱和 度 增强 与 色调 增强 的 结果 


名 题 面 : 

试 分 析 采 用 饱和 度 增强 方法 和 色调 增强 方法 所 得 到 的 结果 图 像 与 原 图 像 相 比 各 有 什么 
变化 。 

如 解析 : 

饱和 度 增强 : 通过 对 图 像 中 每 个 像素 的 饱和 度 单独 进行 处 理 来 实现 ,一 般 可 以 是 总 体 
乘 上 或 者 加 上 一 个 常数 ,也 可 以 通过 类 似 于 直方 图 均衡 化 等 方式 进行 饱和 度 的 增强 。 增 强 
饱和 度 后 ,图 像 中 的 彩色 更 为 饱和 ,反差 增加 ,边缘 清晰 。 减 小 饱和 度 后 ,由 于 色 度 图 的 中 点 
是 一 个 奇异 点 , 故 原 图 像 中 饱和 度 低 的 部 分 将 会 渐渐 趋 于 灰白 色 , 整 幅 图 像 颜色 看 起 来 比较 
平淡 , 且 奇 异 点 附近 的 RGB 值 会 因为 很 小 一 点 的 波动 而 产生 很 大 的 变化 。 

色调 增强 : 根据 HSI 模型 的 表示 方法 ,色调 对 应 的 是 在 色 度 三 角形 中 指向 色 点 PP 的 矢 
量 与 R 轴 的 夹 角 , 因 此 可 以 看 出 色调 的 变化 是 循环 往复 的 。 如 果 在 增强 时 对 每 个 像素 的 色 
调 加 一 个 常数 , 即 会 使 对 应 的 色 点 矢量 旋转 一 个 角度 ,从 而 在 色谱 上 移动 。 当 这 个 常数 较 小 
时 ,一 般 会 使 彩色 图 像 的 色调 根据 色 点 失 量 转动 的 方向 (由 该 常数 的 正 负 决 定 ) 而 变 “ 冷 ?或 


8-11 分 段 运动 轨迹 


如 题 面 : 

设 一 个 点 在 空间 的 运动 可 分 成 5 个 等 间隔 的 阶段 ,在 第 一 个 阶段 沿 X 轴 方 向 匀 加 速 运 
动 ,在 第 二 个 阶段 沿 与 Y 轴 和 Z 轴 角 分 线 平行 的 方向 匀速 运动 ,在 第 三 个 阶段 沿 Y 轴 方 向 
匀速 运动 ,在 第 四 个 阶段 沿 Z 轴 方 向 匀 减 速 运动 ,在 第 5 个 阶段 沿 与 X 轴 和 Z 轴 角 分 线 平 
行 的 方向 匀 减 速 运动 。 试 分 别 做 出 该 点 沿 3 个 轴 的 运动 轨迹 的 示意 图 。 

名 解析 : 

该 点 在 3-D 空间 的 运动 轨迹 可 参见 图 解 8-11(1)。 

如 果 将 3-D 空间 中 的 运动 轨迹 分 别 向 对 应 的 平面 投影 , 则 得 到 该 点 沿 3 个 轴 的 运动 轨 
迹 如 图 解 8-11(2) 所 示 ,其 中 图 解 8-11(2a) 为 沿 X 轴 的 轨迹 图 ,图 解 8-11(2b) 为 沿 Y 轴 的 
轨迹 图 ,图 解 8-11(2c) 为 沿 Z 轴 的 轨迹 图 。 
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图 解 8-11(1) 点 在 3-D 空间 的 运动 轨迹 示意 
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图 解 8-11(2) 点 沿 3 个 轴 的 运动 轨迹 
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8-12 ”累积 差 图 像 的 计算 


名 题 面 : 
在 一 个 由 4 幅 5X5 像素 的 图 像 构 成 的 图 像 序列 中 有 一 个 匀速 运动 的 均匀 灰 度 目标 。 
假设 目标 灰 度 为 1 ,背景 灰 度 为 0, 最 终 绝 对 累积 差 图 像 








了 人 守 才 LE | 
和 负 累 积 差 图 像 分 别 如 图 题 8-12(a) 和 图 题 8-12(b) 所 |o 1 ，21 0 1 221 
示 ( 国 值 为 0) 。 是 让 信人 耳 及 
、 一 可 3 到 0 001 0 0 
(1) 根据 这 些 图 像 推断 目标 在 第 一 幅 图 像 中 的 初始 和 
位 置 .运动 方向 和 速度 。 机 而 
(2) 根据 (1) 的 结果 , 写 出 计算 各 个 累积 差 图 像 的 过 时 
程 ,验证 (1) 中 结果 的 正确 性 。 图 题 8-12 ”最 终 绝对 累积 差 图 像 和 
二 解析 ， 负 累 积 差 图 像 


(1) 设 4 幅 图 像 的 序号 分 别 为 1、2、3、4, 则 最 终 绝对 累积 差 图 像 和 负 累 积 差 图 像 分 
别 为 : 


UE 0 0 2 1 

a | 人 及 交工 

A=|3 221 0|, N=|00210 

3 0 0 0 0 

3 0 0 

据 此 ,可 算得 正 累 积 差 图 像 为 : 

| 0 00 .000 
全 | 01221 00 .000 
P, 一 4 一 Ni 一 |32210-loo21 0l|=|3 2000 
半 吕 和 | | 人 0 0 
5800 vod ls st 





因为 正 累积 差 图 像 中 的 非 零 元 素 位 置 就 是 运动 目标 在 参考 图 中 的 位 置 ,又 因为 设 目标 灰 度 
为 1, 所 以 该 目标 的 初始 位 置 可 表示 为 (其 中 值 为 1 的 代表 目标 部 分 ) : 

















根据 绝对 累积 差 图 像 ,数值 沿 右 斜 上 方向 改变 ,所 以 目标 朝 着 右 斜 上 方向 运动 。 
根据 负 累 积 差 图 像 ,可 以 算出 目标 在 水 平方 向 上 的 运动 速度 是 N (3,，3) 一 Ni (3，4) 一 
2 一 1 二 1, 在 垂直 方向 上 的 运动 速度 是 N (3, 3) 一 Ni (4, 3) 王 2 一 1 王 1。 所 以 ,目标 沿 45" 方 向 运 
动 ,在 相 邻 两 图 像 的 时 间 间 隔 中 ,目标 沿 水 平方 向 (向 右 ) 和 垂直 方向 (向 上 ) 各 运动 了 一 个 像素 。 
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(2) 根据 (1) 的 结果 ,可 写 出 这 4 幅 图 像 应 该 是 : 
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差 图 像 依次 是 : 
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设 所 有 累积 差 图 像 的 初始 矩阵 都 是 零 矩 阵 , 则 依次 可 算得 
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最 后 得 到 的 A 和 N, 与 所 给 的 条 件 相同 ,(1) 中 结果 得 到 验证 。 


8-13 图像 金字 塔 表达 


名 题 面 : 

(1) 对 一 幅 512X512 像素 的 图 像 ,其 完整 的 图 像 金字 塔 共有 多 少 层 ? 

(2) 如 果 用 不 考虑 第 0 层 的 图 像 金字 塔 来 表示 该 图 像 ,获得 的 数据 压缩 率 是 多 少 ( 这 里 
设 表达 每 个 单元 都 用 一 个 字 节 )? 

本 解析 : 

(1) 10 层 。 

(5. 


8-14 ”高 斯 和 拉 普 拉 斯 金字 塔 的 构建 


名 题 面 : 
给 定 如 下 所 示 图 像 ,构建 其 高 斯 金字 塔 和 拉 普 拉 斯 金字 塔 (这 里 设 2X2 的 高 斯 滤波 器 
为 一 个 均值 滤波 器 ,而 拉 普 拉 斯 滤波 器 为 一 个 直通 滤波 器 ) : 


0 1 2 3 
4 5 6 7 
i 
12 13 14 15 
总 解 析 : 
对 原 图 像 进行 2X2 平均 得 到 
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2 恒生 所 
| ed 
再 平均 一 次 得 到 [7.5]。 所 以 高 斯 金字 塔 的 0 层 到 2 层 分 别 为 
区 刀 .多 和 旭 
要 混交 了 上 要 全 本人 
8 0 Ww Fw 说 :5 
ji 区 柳 : 更 政 
对 由 原 图 像 2X2 平均 得 到 的 结果 进行 扩展 插值 得 到 
吕 呈 名 :导入 司 入 丰 
35 了 中 渤 晤 ”六 看 
105 W065 I 
105 WW i 5 
这 样 拉 普 拉 斯 金字 塔 的 第 0 层 为 


FF 到 








0 1 2 3 2.5 2.5 4.5 4.5 2.5 1.5 2.5 ,县 
4 5 6 7 和 5 六 有 本 5 Ls 2.5 1.5 2.5 
8 0 WwW Wm| |I05 WS lizd GE 国 2.5 1.5 2.5 1.5 
12 13 14 15 10.5 10.5 12.5 12.5 15 2.5 1.5 2.5 


同 理 , 拉 普 拉 斯 金字 塔 的 第 1 层 为 
2 
| we 7 |- | 3 | 
最 后 , 拉 普 拉 斯 金字 塔 的 第 2 层 为 [7. 5]。 
所 以 拉 普 拉 斯 金字 塔 的 0 层 到 2 层 分 别 为 











2.5 1.5 2.5 1.5 
1.5 2.5 1.5 2.5|[—5 一 3 
5 5 | EE 可 
2.5 1.5 2.5 1.5 3 5 
1.5 2.5 1.5 2.5 


8-15 ”检测 和 消除 边缘 时 的 小 波 特性 


名 题 面 : 
如 何 根据 小 波 特性 从 图 像 中 检测 和 消除 边缘 ? 讨论 一 下 其 中 频率 和 尺度 所 起 的 
作用 。 
气 解析 : 
首先 需要 确定 一 个 小 波 (平滑 函数 的 一 阶 导 数 ) 和 对 它 的 分 解 级 数 ( 对 应 尺度 *) ,并 对 
图 像 进 行 多 尺度 小 波 变换 。 巾 于 小 波 具有 能 量 集 中 特性 ,边缘 对 应 灰 度 的 突变 点 ,所 以 在 边 
缘 处 ,对 应 小 波 系数 的 模 值 会 比较 大 。 因 此 , 取 小 波 变 换 系数 的 模 极 大 值 并 与 预先 设 定 的 阔 
值 了 进行 比较 ,就 可 将 对 应 边缘 的 点 检测 出 来 。 在 对 边缘 消除 时 ,可 以 在 空域 中 将 如 此 检 
测 出 来 的 边缘 点 除去 ; 也 可 在 频率 域 中 减 小 小 波 变 换 系 数 中 高 频 分 量 对 应 的 值 ,并 增强 低 
频 分 量 对 应 的 值 。 
。 05 。 


频率 可 以 起 到 调整 时 域 和 频 域 分 辩 率 的 作用 。 低 频 时 带宽 罕 ,频率 分 辩 率 高 ; 而 高 频 
时 正好 相反 。 高 频率 时 ,小 波 变换 滤波 器 具有 较 大 的 带宽 ,时 间 窗 比较 窗 而 时 间 分 辩 率 比较 
高 ; 而 低频 率 时 ,小 波 变换 滤波 器 具有 较 小 的 带宽 ,时 间 窗 比较 宽 而 时 间 分 辩 率 比较 低 。 通 
过 调节 尺度 参数 可 以 改变 小 波 基 的 带宽 ,以 构建 长 度 不 同 的 自 适应 滤波 器 ,改进 滤波 的 收敛 
性 能 。 
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本 单元 包括 3 章 : 
第 9 章 图 像 分 割 
第 10 章 目标 表达 描述 
第 11 章 特性 分 析 


覆盖 范围 /内 容 简介 

图 像 分 析 对 应 图 像 工程 的 第 二 层次 。 作 为 图 像 工程 的 中 间 层 次 ,图 像 分 析 的 抽象 性 居 
中 ,语义 层次 比 图 像 处 理 高 但 比 图 像 理解 低 。 它 主要 在 图 像 的 目标 级 别 上 进行 操作 ,涉及 的 
数据 量 比 图 像 处 理 小 但 比 图 像 理解 大 。 

图 像 分 析 可 看 作 代表 一 大 类 图 像 技术 ,着 重 强调 对 图 像 中 感 兴趣 的 目标 进行 检测 和 测 
量 , 以 获得 它们 的 客观 信息 从 而 建立 对 图 像 和 目标 的 描述 ,并 分 析出 它们 的 特性 。 如 果 说 图 
像 处 理 是 一 个 从 图 像 到 图 像 的 过 程 , 则 图 像 分 析 是 一 个 从 图 像 到 数据 的 过 程 , 它 把 原来 以 像 
素描 述 的 图 像 转变 成 比较 简洁 的 基于 目标 的 非 图 形式 的 描述 。 这 里 数据 可 以 是 对 目标 特征 
测量 的 结果 ,或 是 基于 测量 的 符号 表示 。 它 们 描述 了 图 像 中 目标 的 特点 和 性 质 。 

图 像 分 析 的 主要 技术 可 分 成 3 类 : 图 像 分 割 、 目 标 表达 和 描述 以 及 特性 分 析 。 图 像 分 
制 是 由 图 像 处 理 进 到 图 像 分 析 的 关键 步骤 , 它 的 目的 就 是 提取 出 图 像 中 的 目标 。 目 标 表 达 
和 描述 要 对 提取 出 的 目标 采取 合适 的 数据 结构 进行 表达 并 采用 恰当 的 形式 描述 它们 的 特 
征 。 特 性 分 析 是 通过 特征 测量 以 有 效 地 刻画 目标 的 各 种 特性 ,满足 各 种 应 用 的 需要 。 图 像 
的 分 割 、 目 标的 表达 和 描述 以 及 特性 的 分 析 等 不 仅 完成 了 图 像 分 析 的 任务 ,还 将 原始 图 像 转 
化 为 更 抽象 、 更 紧凑 的 形式 ,使 得 更 高 层 的 图 像 理解 成 为 可 能 。 

图 像 分 析 还 会 用 到 许多 “数学 工具 ”。 其 中 ,比较 结合 密切 的 包括 数学 形态 学 和 模式 识 








别 等 ,有 关内 容 将 安排 在 第 5 单元 介绍 。 
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图 像 分 割 是 图 像 分 析 的 第 一 个 步骤 , 它 将 所 关注 的 目标 提取 出 来 ,使 得 进一步 的 分 析 工 
作成 为 可 能 。 图 像 分 割 要 把 图 像 分 离 成 各 具 独 特性 质 的 区 域 并 提取 出 感 兴趣 的 目标 区 域 
(3-D 图 像 中 是 目标 立体 )。 这 里 独特 的 性 质 可 以 是 灰 度 、 颜 色 、 纹 理 等 特性 ,一 般 都 对 应 有 
一 定 的 语义 含义 (近年 为 强调 常 称 语义 分 割 ); 目标 可 以 对 应 单个 区 域 ,也 可 以 对 应 多 个 
区 域 。 

对 图 像 分 割 的 研究 已 有 半 个 多 世纪 的 历史 ,提出 的 算法 也 已 成 千 上 万 ,而 且 还 在 不 断 发 
展 中 。 究 其 原因 : 一 方面 ,图 像 分 割 至 今 还 没有 通用 的 自身 理论 ,所 以 结合 新 的 数学 工具 就 
总 有 新 特色 的 方法 被 提出 来 ; 另 一 方面 ,要 分 割 的 图 像 来 自 许多 领域 和 环境 ,所 以 特殊 的 分 
荐 需求 也 催生 了 许多 特殊 或 特定 的 算法 。 

图 像 分 割 要 将 区 域 提取 出 来 ,而 区 域 是 由 其 轮廓 所 划 定 的 ,所 以 图 像 分 割 需 要 把 握 区 域 
和 轮廓 的 特点 。 传 统 的 图 像 分 割 方法 主要 直接 基于 区 域 和 轮廓 的 特性 来 进行 ,而 新 的 方法 
引入 了 更 多 数学 工具 和 技术 手段 ,如 贝 叶 斯 理论 、 分 形 理论 .高 斯 混合 分 布 、 盖 伯 滤 波 器 、 机 
器 学 习 、 马 尔 可 夫 随 机 场 、 深 度 学习 ,数学 形态 学 .遗传 算法 .专家 系统 等 。 

另外 ,需要 分 割 的 图 像 也 越 来 越 多 样 化 ,如 3-D 图 像 .4-D 图 像 .视频 图 像 .立体 图 像 深 
度 图 像 .多 视图 像 、 多 波段 图 像 以 及 各 种 属性 的 图 像 等 。 对 分 割 的 要 求 也 越 来 越 高 ,如 亚 像 
素 级 的 分 割 精度 .实时 的 分 割 速 度 等 。 

对 图 像 的 分 割 还 有 一 个 重要 分 支 是 对 图 像 分 割 的 评价 ,包括 对 算法 和 结果 的 性 能 刻 面 
和 性 能 比较 。 前 者 是 要 把 握 某 个 算法 在 不 同 分 割 情 况 中 的 表现 ,而 后 者 是 要 比较 不 同 算法 
在 分 割 给 定 图 像 时 的 性 能 。 分 割 评价 对 改善 分 割 算 法 的 性 能 、 提 高 分 割 的 质量 和 效率 、 适 应 
各 种 分 割 需求 不 可 或 缺 。 

本 章 的 问题 涉及 上 述 图 像 分 割 多 个 方面 的 概念 。 


9-1 体 素 的 积分 密度 


也 题 面 : 

考虑 其 中 心 处 在 坐标 系统 原点 的 体 素 , 它 的 一 个 与 YZ 平面 平行 的 轮廓 面 与 X 轴 交 于 
(0.2, 0, 0) , 试 计算 该 体 素 的 积分 密度 。 

各 解析 : 

该 轮廓 面 的 方程 为 : x 一 0. 2 二 0。 对 比 平面 表达 式 zcosae 十 ycos8 十 xcosy 一 0 一 0, 可 知 : 
4 一 cosa 一 1,0 一 cos8 一 0,c 一 cosy 一 0,o 一 0.2, 且 满足 o 三 (a 一 6 一 c)/2。 该 体 素 的 积分 密度 
为 Ta,8,y,p) 一 一 o/a 十 1/2 一 一 0.2/1 十 1/2=0.3。 











9-2 不 同 微分 算 子 的 效果 比较 


各 题 面 : 

选择 一 幅 图 像 ,试用 3 种 基本 的 梯度 算 子 (罗伯特 交叉 算 子 、 薄 瑞 维特 算 子 和 索 贝 尔 算 
子 ) 以 及 拉 普 拉 斯 算 子 检测 图 中 的 边缘 ,比较 它们 的 效果 。 

各 解析 : 

选择 的 原始 图 像 和 边缘 检测 的 实验 结果 见 图 解 9-2。 其 中 图 解 9-2(a) 是 选择 的 原始 图 
像 ,图 解 9-2(b) 是 用 拉 普 拉 斯 算 子 检测 出 的 边缘 ,图 解 9-2(c) 是 用 罗伯特 交叉 算 子 检测 出 
的 边缘 ,图解 9-2(d) 是 用 薄 瑞 维特 算 子 检测 出 的 边缘 ,图 解 9-2(Ce) 是 用 索 贝 尔 算 子 检测 出 
的 边缘 。 可 见 在 这 个 实验 中 , 拉 普 拉 斯 算 子 不 仅 检测 出 了 下 部 的 卡通 人 物 形象 ,还 检测 出 了 
上 部 的 字母 ,其 提取 边缘 的 灵敏 度 比 另 外 3 种 梯度 算 子 都 要 好 一 些 。 

另外 ,3 种 梯度 算 子 之 间 也 有 一 些 区 别 。 图 解 9-2(f 是 罗伯特 交叉 算 子 与 索 贝 尔 算 子 
检测 结果 的 差别 ,图 解 9-2(g) 是 蒲 瑞 维特 算 子 与 索 贝 尔 算 子 检测 结果 的 差别 。 它 们 都 是 利 
用 图 像 减法 对 相应 检测 结果 求 差 而 得 到 的 。 





(f) (加 


图 解 9-2 原始 图 像 和 边缘 检测 实验 结果 


9-3” 拉 普 拉 斯 值 的 计算 


各 题 面 : 
对 图 像 f(x,y) ,直接 用 下 式 计算 其 拉 普 拉 斯 值 : 
yf= of i Ff 


zz ay’ 








与 令 六 二 十 六, 以 对 7 求 二 阶 导 数 , 即 用 下 式 与 /f(x,y) 卷 积 来 计算 其 拉 普 拉 斯 值 : 


je f= - 存 ] 
v= ( 未 je 





有 什么 不 同 ? 

扣 解 析 : 

前 者 是 一 种 二 阶 微分 算 子 ,对 图 像 中 的 噪声 比较 敏感 。 

后 者 表达 的 是 先 对 图 像 进 行 一 次 高 斯 平滑 滤波 (利用 高 斯 加 权 平 滑 函 数 : 六 (zyy) 一 
exp( 一 r?/20?) 与 原 图 像 进 行 卷 积 ) 后 再 进行 二 阶 微分 运算 。 因 为 相对 前 者 多 了 一 次 平滑 滤 
波 , 所 以 减少 了 噪声 的 影响 。 如 果 利 用 后 者 检测 过 零点 也 能 提供 较 可 靠 的 边缘 位 置 。 

后 者 的 另 一 个 好 处 是 可 以 通过 参数 o 来 调整 后 续 运算 的 结果 。 例 如 在 检测 边缘 时 ,使 用 小 
的 o 可 检测 到 较 多 的 边缘 点 ,而 使 用 大 的 o 可 对 噪声 有 较 大 的 抑制 作用 , 减 小 虚假 边缘 点 的 检 出 。 


9-4 “最 小 核 同 值 区 和 索 贝 尔 算 子 


名 题 面 : 

试 编 程 实现 最 小 核 同 值 区 算 子 和 索 贝 尔 算 子 , 并 收集 一 些 有 噪声 图 像 ( 或 对 图 像 加 噪 )， 
比较 它们 在 检测 图 像 中 边缘 点 的 效果 并 讨论 之 。 

各 解析 : 


下 面 给 出 3 组 实验 结果 并 对 结果 进行 讨论 。 

(1) 选取 的 图 像 如 图 解 9-4(1a) 所 示 , 用 最 小 核 同 值 区 算 子 取 几 何 阔 值 G==3S./4 得 
到 的 边缘 检测 结果 如 图 解 9-4(1b) 所 示 ,用 索 贝尔 算 子 得 到 的 边缘 检测 结果 如 图 解 9-4(1c) 
所 示 。 对 图 像 添加 均值 为 0, 标准 差 vc 一 1 的 高 斯 白 噪 声 后 ,再 对 图 像 进行 处 理 得 到 的 结果 
分 别 见 图 解 9-4(1d) 和 9-4(1e)。 





(b) (9) (d) 
图 解 9-4(1) 第 一 幅 图 像 及 实验 结果 
对 比 两 种 算 子 的 处 理 结果 .可 以 发 现 利 用 最 小 核 同 值 区 算 子 比索 贝尔 算 子 提取 得 到 的 


边缘 在 部 分 轮廓 处 更 宽 一 些 , 但 强度 弱 一 些 。 这 是 由 于 前 者 进行 的 是 积分 运算 ,梯度 变化 较 
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弱 处 也 可 积累 一 定 的 边缘 响应 ,所 以 边缘 较 宽 ; 而 后 者 进行 的 是 差分 运算 ,因此 只 在 变化 较 
为 显著 的 区 域 可 以 得 到 较 大 的 边缘 响应 ,因此 边缘 较 罕 。 
对 比 有 无 噪声 的 情况 ,可 以 发 现 添加 噪声 后 利用 最 小 核 同 值 区 算 子 比索 贝尔 算 子 得 到 
的 轮廓 更 为 完整 。 索 贝尔 算 子 将 一 些 噪声 点 也 提取 为 边缘 , 即 对 噪声 较为 敏感 。 

(2) 选取 的 图 像 如 图 解 9-4(2a) 所 示 , 用 最 小 核 同 值 区 算 子 取 几 何 冰 值 G 一 3S。../4 所 
示 得 到 的 边缘 检测 结果 如 图 解 9-4(2b) 所 示 ,用 索 贝 尔 算 子 得 到 的 边缘 检测 结果 如 图 解 9-4 
(2c) 所 示 。 对 图 像 添加 均值 为 0, 标准 差 vc 一 10 的 高 斯 白 噪 声 后 ,再 对 图 像 进行 处 理 得 到 的 
结果 分 别 见 图 解 9-4(2d) 和 图 解 9-4(2e) 


ma ge 
Engineening 
a (b) (9) 


(d) (e) 




















图 解 9-4(2) 第 二 幅 图 像 及 实验 结果 


可 以 看 出 ,前 者 检测 出 的 边缘 较 细 , 角 点 和 边缘 点 有 一 定 的 区 别 ( 对 应 角 点 处 的 强度 较 
大 ); 后 者 检测 出 的 边缘 较 粗 , 角 点 和 边缘 点 没有 明显 的 区 别 。 另 外 ,前 者 可 通过 参数 G 调 
节 对 角 点 的 检测 能 力 , 但 后 者 没有 参数 可 以 调节 。 

(3) 选取 Lena 图 像 实验 。 用 最 小 核 同 值 区 算 子 取 几 何 冰 值 G==3S;。…/4 得 到 的 边缘 检 
测 结果 如 图 解 9-4(3a) 所 示 ,用 索 贝 尔 算 子 得 到 的 边缘 检测 结果 如 图 解 9-4(3b) 所 示 。 如 果 
对 图 像 添 加 均值 为 0, 标准 差 vc 一 1 的 椒盐 噪声 , 则 得 到 的 图 像 如 图 解 9-4(3c) 所 示 。 用 两 种 
算 子 对 该 图 像 进行 分 割 得 到 的 结果 分 别 见 图 解 9-4(3d) 和 图 解 9-4(3e) 。 





图 解 9-4(3) 第 三 幅 图 像 及 实验 结果 


可 以 看 出 ,在 没有 释 加 噪声 时 两 者 的 检测 效果 都 还 令 人 满意 ,差别 不 大 ,主要 边缘 线 都 
仿 测 出 来 了 。 但 琶 加 噪声 后 ,因为 前 者 比较 抗 噪声 ,所 以 效果 (边缘 处 的 强度 比 噪声 处 的 强 
度 高 得 更 明显 ) 比 后 者 更 好 (后 者 对 边缘 点 和 噪声 点 的 区 别 较 差 ) 。 


9-5 灰 度 -梯度 散射 图 


有 哪些 因素 会 影响 灰 度 -梯度 散射 图 中 聚 类 的 形状 ? 它们 是 如 何 影响 的 ? 





%» OR a 


气 解析 : 

影响 灰 度 -梯度 散射 图 中 聚 类 形状 的 主要 因素 包括 : 目标 的 灰 度 分 布 (影响 目标 像素 聚 
类 的 形状 ) .背景 的 灰 度 分 布 ( 影 响 背 景 像 素 聚 类 的 形状 )、 目 标 轮廓 的 灰 度 分 布 ( 影 响 边 界 像 
素 聚 类 的 形状 ) 目标 轮 廓 的 宽窄 (影响 边界 像素 聚 类 的 大 小 及 与 目标 像素 聚 类 和 背景 像素 
聚 类 的 距离 )。 如 果 目 标 像素 的 聚 类 和 背景 像素 的 聚 类 比较 接近 , 则 灰 度 冰 值 较 难 确定 ; 如 
果 边 界 像素 的 聚 类 与 目标 像素 的 聚 类 及 背景 像素 的 聚 类 比较 接近 , 则 梯度 阔 值 较 难 确定 。 


9-6 ”基于 过 渡 区 的 装 值 分 割 





各 题 面 : 

选取 一 幅 实际 图 像 , 利 用 基于 过 渡 区 的 阔 值 分 割 方法 进行 分 割 实验 。 

气 解 析 ， 

选取 的 图 像 如 图 解 9-6(a) 所 示 , 其 直方 图 如 图 解 9-6(b) 所 示 。 图 解 9-6(Cc) 和 
图 解 9-6(d) 分 别 给 出 EAGio(L) 和 EAGsios(L) 曲 线 。 在 图 解 9-6(c) 中 有 两 个 峰 , 分 别 对 应 
Liow 一 69 和 Liow 二 174; 在 图 解 9-6(d) 中 有 两 个 峰 , 分 别 对 应 Li 一 53 和 La 一 151。 在 
[69, 151] 区 间 取 像素 的 平均 灰 度 得 到 分 割 冰 值 85, 对 图 解 9-6(a) 进 行 分 割 得 到 
图 解 9-6(e) 。 利 用 拉 普 拉 斯 算 子 将 图 中 字母 轮廓 检测 出 来 ,得 到 图 解 9-6(f) 。 
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图 解 9-6 ”基于 过 渡 区 的 阔 值 分 割 
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9-7 ”克服 分 水 岭 算 法 过 分 割 的 方法 


名 题 面 : 


在 使 用 分 水 岭 分 割 算法 时 ,有 可 能 产生 过 分 割 的 问题 。 试 查阅 相关 文献 ,看 看 为 解决 该 
问题 已 提出 哪些 方法 ,讨论 一 下 它们 的 优 缺点 。 


气 解析 : 


一 些 方法 及 其 优 缺点 归纳 在 表 解 9-7 中 。 


表 解 9-7 ”克服 分 水 岭 算法 过 分 割 的 方法 一 览 























方 法 优点 缺点 
和 可 降低 对 实 度 信息 影响 较 大 的 噪声 因素 ,合理 地 改进 | 没有 从 根本 上 解决 传统 
原 方法 产生 的 过 分 割 问题 分 水 岭 算法 的 缺点 
自动 标记 不 易 实现 , 生 
ee 能 有 效 地 避免 过 分 割 现象 ,已 得 到 广泛 使 用 分 割 边界 的 精度 随 标记 
数量 的 增多 而 减 小 
结合 模糊 关系 的 小 | 利用 了 边缘 信息 并 加 入 了 区 域 邻接 关系 的 判定 ,分 割 | 算法 运算 量 较 大 ,在 小 
区 域 合并 准确 率 高 ,轮廓 清晰 明显 区 域 合并 速度 上 较 慢 
We 可 减少 有 噪声 时 的 过 分 割 问题 ,在 低 分 辩 率 上 进行 分 | 算法 速度 还 不 够 快 。 不 
和 荐 时 能 提高 速度 ,兼顾 了 分 割 的 准确 性 与 分 割 效率 ”| 能 适合 所 有 应 用 要 求 
基于 形态 学 尺度 空 | 在 平滑 原始 图 像 的 同时 保留 重要 的 区 域 轮廓, 可 去 除 一 
间 和 梯度 修正 容易 造成 过 分 割 的 区 域 细节 和 噪声 时 
9-8 ”使 用 遗传 算法 分 割 
各 题 面 : 


考虑 如 图 题 9-8(a) 所 示 的 合成 场景 图 , 它 表示 一 个 球 (B) 在 草地 (L) 上 。 初 步 分 割 得 
到 了 5 个 初始 区 域 R;,i 二 1~5, 在 图 中 简 记 为 1 一 5。 现 考虑 使 用 遗传 算法 进行 分 割 。 两 组 
初始 分 割 假设 图 分 别 如 图 题 9-8(b) 和 图 题 9-8(c) 所 示 。 它 们 对 应 的 码 串 各 是 什么 样 的 ? 
列 出 接 下 来 的 复制 交叉、 变异 过 程 , 并 给 出 最 终 的 分 割 图 。 








图 题 9-8 合成 场景 图 及 两 组 初始 分 割 假设 图 








» Oe 


气 解 析 : 

两 组 分 割 假设 所 对 应 的 码 串 分 别 为 BLLLB 和 BBLBL 。 

先 在 第 2 和 第 3 位 置 之 间 进行 第 1 次 交叉 ,可 以 得 到 码 串 BLLBL 和 BBLLB ,它们 对 
应 的 分 割 假设 图 分 别 如 图 解 9-8(1a) 和 图 解 9-8(1b) 所 示 。 











5 








(b) 
图 解 9-8(1) 第 1 次 交叉 后 的 分 割 假设 图 


这 里 两 组 初始 分 割 假设 图 和 两 组 第 1 次 交叉 后 的 分 割 假设 图 的 置信 度 Ciee 均 为 零 。 

接 下 来 对 BLLBL 在 第 1 位 置 进 行 变异 ,得 到 变异 结果 LLLBL ,其 对 应 的 分 割 假设 图 
如 图 解 9-8(2a) 。 随 机 选择 BLLLB 并 与 LLLBL 在 第 4 位 置 和 第 5 位 置 之 间 进行 第 2 次 
交叉 ,可 以 得 到 码 串 BLLLL 和 LLLBB ,它们 对 应 的 分 割 假设 图 分 别 如 图 解 9-8(2b) 和 
图 解 9-8(2c) 所 示 。 











图 解 9-8(2) 第 2 次 交叉 前 后 的 分 割 假设 图 


计算 第 2 次 交叉 前 后 分 割 假设 图 的 置信 度 ,可 以 得 到 BLLLB 的 Ci 一 0,LLLBL 的 
Cimee 二 0. 12,BLLLL 的 Ce 一 0,LLLBB 的 Ce 一 0.14。 据 此 ,可 将 BLLLB 和 BLLLL 
两 个 码 串 消去 。 

进一步 对 LLLBL 在 第 3 位 置 进 行 变异 ,得 到 变异 结果 LLBBL ,其 对 应 的 分 割 假设 图 
如 图 解 9-8(3a) 。 将 它 与 LLLBB 两 个 码 串 在 第 4 位 置 和 第 5 位 置 之 间 进行 第 3 次 交叉 ,可 
以 得 到 码 串 LLBBB 和 LLLBL。 它 们 对 应 的 分 割 假设 图 分 别 如 图 解 9-8(3b) 和 图 解 9-8(3c) 
所 示 。 

计算 第 3 次 交叉 前 后 分 割 假设 图 的 置信 和 度 , 可 以 得 到 LLBBL 的 Ci 一 0.18,LLLBB 
的 Ci 一 0. 14,LLBBB 的 Cimwge 二 1,LLLBL 的 Cisge 二 0.14。 

LLBBB 具有 最 高 的 置信 度 ,算法 停止 最 优 计算 ,最 终 的 分 割 图 为 图 解 9-8(3b) 。 
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(a) (b) (c) 


图 解 9-8(3) 第 3 次 交叉 前 后 的 分 割 假设 图 


各 题 面 : 
-个 三 角形 的 3 个 顶点 坐标 分 别 为 (10, 0)、(10, 10)、(0， 
10) ,如 图 题 9-8 所 示 。 请 借助 MATLAB 仿真 对 它 的 3 条 边 
分 别 进行 哈 夫 变换 。 对 图 题 9-9 加 一 些 噪 声 ,看 看 有 什么 变化 。 
如 解 析 : 
对 3 条 边 分 别 进行 哈 夫 变换 仿真 





图 题 9-9 三 角形 示意 图 
声 得 到 图 解 9-9(1c) ,对 应 的 变换 域 图 像 如 图 解 9-9(1d) 所 示 


(a) (b) 时 


(d) 





图 解 9-9(1) 对 (10, 0) 和 (10, 10) 之 间 直 线 的 哈 夫 变换 


(2) 对 (10, 0) 和 (10, 10) 之 间 的 直线 ,其 原 图 像 与 变换 域 图 像 分 别 如 图 解 9-9(2a) 和 图 解 
9-9(2b) 所 示 。 将 原 图 像 加 噪声 得 到 图 解 9-9(2c) ,对 应 的 变换 域 图 像 如 图 解 9-9(2d) 所 示 。 


(a) 


图 解 9-9(2) 对 (10, 0) 和 (10, 10) 之 间 直 线 的 哈 夫 变换 





(b) 


(3) 对 (0, 10) 和 (10, 10) 之 间 的 直线 ,其 原 图 像 与 变换 域 图 像 分 别 如 图 解 9-9(3a) 和 图 
解 9-9(3b) 所 示 。 将 原 图 像 加 噪声 得 到 图 解 9-9(3c) ,对 应 的 变换 域 图 像 如 图 解 9-9(3d) 
所 示 。 





图 解 9-9(3) 对 (0, 10) 和 (10, 10) 之 间 直 线 的 哈 夫 变换 


9-10 ”从 2-D 哈 夫 变换 推广 到 3-D 哈 夫 变换 


名 题 面 : 
试 将 用 于 检测 直线 的 2-D 哈 夫 变换 推广 成 可 以 检测 平面 的 3-D 哈 夫 变换 。 
如 解析 1: 


在 XYZ 空间 中 过 点 (zx，y， zx) 的 平面 可 表示 为 ar 十 by 十 cx 一 1, 它 在 参数 空间 ABC 中 
唯一 地 确定 了 一 个 点 (a, b,c)。 所 以 XYZ 空间 的 一 个 平面 与 ABC 空间 中 的 一 个 点 对 应 。 

考虑 XYZ 空间 中 的 3 个 点 (zi，ywy zi) (zy yy sx)、Czy， ws), 则 过 这 3 个 点 的 平 
面 分别 对 应 ABC 空间 中 的 3 个 平面 cz 十 byi 十 c 阅 一 1.azi 十 by 十 cz 一 1 az 十 0 十 c 你 一 
1。 设 这 3 个 面 在 参数 空间 中 相交 于 点 (oo, bo, co), 则 上 述 3 个 点 都 满足 coz 十 boy 十 cox 一 
1, 即 3 个 点 在 XYZ 空间 中 共 面 。 

由 上 可 见 ,2-D 空间 中 的 点 - 线 对 偶 性 与 3-D 空间 中 的 点 - 面 对 偶 性 是 对 应 的 。 所 以 , 增 
加 一 个 参数 ,就 可 将 检测 直线 的 2-D 哈 夫 变换 推广 成 可 以 检测 平面 的 3-D 哈 夫 变换 。 

各 解析 2: 

考虑 直角 坐标 系 XYZ 中 的 3-D 平面 : = 一 az 十 0 十 c。 利 用 哈 夫 变换 检测 XYZ 空间 
的 一 些 点 是 否 共 平 面 的 具体 步骤 如 下 

(1) 对 参数 空间 中 参数 a、b 和 * 的 可 能 取 值 范围 进行 量化 ,根据 量化 结果 构造 一 个 累 
加 数组 ACaws: anss， max Cmin: Cmax ) ， 并 初始 化 为 零 ; 

(2) 对 每 个 XYZ 空间 中 的 给 定点 让 a 和 4。 分 别 取 遍 所 有 可 能 的 值 ,利用 平面 方程 计算 
出 cc, 根据 a、b 和 ec 的 值 累加 A: A(a, b,c)=Ala,b, c) 十 1; 

(3) 根据 累加 后 A 中 最 大 值 所 对 应 的 a 、b 和 c ,利用 平面 方程 确定 出 XYZ 空间 中 的 一 
个 平面 ,A 中 的 最 大 值 代表 了 在 此 平面 上 给 定点 的 数目 ,满足 平面 方程 的 点 就 是 共 面 的 。 

名 解 析 3: 

考虑 极 坐 标 系 A@@O 中 的 3-D 平面 : 人 一 zsinb cosg 十 ysing sing 十 xcosg。 利 用 哈 夫 变换 
检测 A@@ 空 间 的 一 些 点 是 否 共 平面 的 具体 步骤 如 下 : 

(1) 对 参数 空间 中 参数 .2 和 5 的 可 能 取 值 范围 进行 量化 ,根据 量化 结果 构造 一 个 累 

0 全 















































加 数组 ACAssis : Xmax Omin : Omax， $min: gmx) ,并 初始 化 为 零 ; 

(2) 对 每 个 和 A989 空间 中 的 给 定点 让 9 和 $$ 分别 取 遍 所 有 可 能 的 值 ,利用 平面 方程 计算 出 
4, 根 据 4.9 和 5 的 值 累加 A: A(X, 9, $8) 二 A(, 9, g) 十 1; 

(3) 根据 累加 后 A 中 最 大 值 所 对 应 的 .2 和 5 ,利用 平面 方程 确定 出 A9O 空 间 中 的 一 个 
平面 ,A 中 的 最 大 值 代表 了 在 此 平面 上 给 定点 的 数目 ,满足 平面 方程 的 点 就 是 共 面 的 。 


9-11 和 矩 保持 法 和 一 阶 微分 期 望 值 法 


名 题 面 : 

对 矩 保持 法 和 一 阶 微分 期 望 值 法 这 两 种 亚 像素 边缘 检测 方法 进行 比较 ,它们 在 检测 较 
平缓 边缘 和 较 陡 峭 边缘 的 位 置 时 有 哪些 特点 ? 

各 解析 : 

对 和 矩 的 计算 与 像素 与 旋转 中 心 的 距离 有 关 , 所 以 矩 保持 法 检测 到 的 亚 像素 位 置 受 边缘 
序列 的 影响 比较 大 ,在 检测 较 平缓 边缘 时 易 产 生 较 大 的 偏差 。 相 对 来 说 ,一 阶 微分 期 望 值 法 
检测 到 的 亚 像素 位 置 受 边缘 序列 的 影响 比较 小 ,所 以 在 检测 较 平缓 边缘 时 会 比较 精确 。 

反 过 来 ,在 检测 较 陡 峭 边缘 的 亚 像素 位 置 时 ,一 阶 征 分 期 望 值 法 容易 受到 个 别 梯度 值 较 
大 点 的 影响 而 发 生 偏差 ( 受 空间 量化 影响 较 大 ); 此 时 ,和 矩 保持 法 相对 较 好 ,因为 在 矩 的 计算 
中 使 用 了 多 个 像素 灰 度 值 (及 其 平方 和 立方 ) 的 积分 。 


9-12 分割 中 的 先 验 信息 





气 题 面 : 

最 小 核 同 值 区 算 子 ,主动 轮 廓 模型 .分 水 岭 分 割 算法 以 及 多 种 (包括 基于 多 分 辩 率 、 过 渡 区 、 
类 间 最 大 交叉 粹 .类 间 最 小 模糊 散 度 ) 阅 值 分 割 算 法 都 很 常用 , 试 分 析 它 们 所 结合 的 先 验 信息 。 

扣 解 析 : 

这 些 方 法 所 结合 的 先 验 信息 归纳 在 表 解 9-12 中 。 


表 解 9-12 不 同方 法 所 结合 的 先 验 信息 








方 法 结合 的 先 验 知识 
(1) 图 像 目标 与 背景 灰 度 值 相差 较 大 ; (2) 目 标 边界 和 角 点 处 灰 度 变化 剧 
最 小 核 同 值 区 算 子 烈 ; (3) 边 界 没有 宽度 ;(4) 图 像 局 部 的 积分 性 质 ; (5) 算 子 模板 的 尺寸 相对 
同 质 区 较 小 





(了) 保持 轮廓 形状 的 内 部 能 量 函 数 以 及 能 根据 边缘 特性 调整 轮廓 局 部 形状 
的 外 部 能 量 函 数 的 先 验 信息 /知识 ;(2) 原 图 像 借助 主动 轮廓 分 割 得 到 的 两 
个 区 域 灰 度 值 上 有 明显 差异 ;(3) 边 界 没有 宽度 , 且 边 界 上 灰 度 变化 较为 剧 
烈 ( 灰 度 不 连续 性 );(4) 区 域内 部 在 灰 度 上 有 连续 性 和 同一 性 

(1) 地 形 学 的 基本 概念 ,适用 于 较 紧凑 物体 之 间 的 分 割 ; (2) 内 部 与 外 部 标 
分 水 岭 分 割 算法 记 的 先 验 知识 ; (3) 区 域内 部 像素 的 灰 度 比较 接近 ,而 相 邻 区 域 像素 之 间 的 
灰 度 差距 比较 大 


主动 轮廓 模型 
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续 表 
方 ” 法 结合 的 先 验 知 识 





(1) 小 波 变换 后 的 多 分 辩 率 特性 知识 ; (2) 待 分 割 的 图 像 中 背景 与 目标 的 灰 


人 度 之 间 有 足够 大 的 差异 ;(3) 图 像 直方 图 的 峰 点 、 谷 点 特性 





类 间 最 大 | (1) 像 素 之 间 的 类 间 交 叉 焙 变化 的 特性 知识 ; (2) 分 割 得 到 的 目标 与 背景 之 
交叉 炳 间 类 间 交 叉 箭 的 差异 性 





























取 辣 值 分 
割 算法 
类 间 最 小 | (1) 类 内 模糊 度 的 性 质 ; (2) 类 间 最 小 模糊 散 度 的 性 质 ; (3) 目 标 或 背景 内 部 
模糊 散 度 的 灰 度 值 一 般 相差 不 大 ,而 边界 处 相差 相对 较 大 
(1) 实 际 图 像 中 边界 有 宽度 ; (2) 过 渡 区 区 域 的 直方 图 性 质 ; (3) 过 渡 区 区 域 
过 渡 区 与 整 幅 图 像 的 面积 比 ;(4) 图 像 中 前 景 与 背景 的 灰 度 分 布 混 释 较 小 ; (5) 实 
际 图 像 中 Lam 二 Lv 
9-13 分割 目 标的 形状 测度 
各 题 面 : 


根据 亮 ( 灰 度 值 132) 的 圆 形 目标 放 在 暗 ( 灰 度 值 100) 的 背景 正中 的 基本 图 ,生成 一 组 8 
幅 256X256 像素 .256 级 灰 度 图 ,目标 面积 分 别 为 全 图 的 20%、15%、10%、5%、3%、2%、 
1% 、0.5%。 计 算 各 图 中 目标 的 形状 测度 SM。 分 析 为 什么 8 个 目标 的 形状 测度 不 完全 
相同 。 

如 解析 : 

形状 测度 之 所 以 不 同 ,是 因为 随 着 目标 面积 的 减 小 ,边界 处 的 梯度 g(xz，y) 变 化 较 快 而 
灰 度 f(z，y) 和 邻 域 灰 度 f(r，y) 不 变 或 基本 不 变 ,g(z, y) 有 减 小 的 趋势 ,所 以 目标 的 形 
状 测度 也 随 目 标 减 小 而 减 小 。 当 目标 面积 趋 于 0 时 ,形状 测度 SM 二 0, 目 标 很 难 检测 到 , 形 
状 也 很 难 测量 。 

生成 的 8 幅 图 像 如 图 解 9-13(1) 所 示 。 








图 解 9-13(1) 生成 的 8 幅 图 像 





对 生成 的 图 像 取 阔 值 得 到 的 结果 如 图 解 9-13(2) 所 示 ( 离 散 轮廓 的 特点 现在 比较 明显 ) 。 





图 解 9-13(2) 取 阔 值得 到 的 8 幅 图 像 


这 8 幅 图 像 中 目标 的 半径 和 形状 测度 值 如 表 解 9-13 所 示 。 
表 解 9-13 8 个 目标 的 半径 和 形状 测度 值 


























编号 1 2 4 | 5 6 1 8 
目标 占 比 | 20% 15% 10% | 5% | 3% 2% 1% 0.5% 

半径 64.592 | 55.938 |45.674 | 32.296 | 25.016 |20.426 | 14.443 10. 213 
形状 测度 0.864 82| 0.70728| 0.50476 0.31921| 0.22912| 0.16474 




















1 2 3 4 5 6 7 8 


图 解 9-13(3) 8 个 目标 的 形状 测度 值 





9-14 ”误差 概率 与 绝对 最 终 测量 精度 


名 题 面 : 
误差 概率 PE 二 Plo)XP(b1o) 十 P(5)XP(o15) 与 取 目 标 面 积 为 特征 而 得 到 的 绝对 最 
终 测量 精度 AUMA: 二 |Ri 一 St| 有 什么 联系 ? 有 什么 区 别 ? 
气 解析 
它们 之 间 的 联系 是 都 考虑 了 由 于 分 割 错误 而 产生 的 错 分 像素 的 个 数 , 并 将 此 用 作 图像 
。 111 。 








质量 衡量 指标 。 区 别 是 前 者 把 目标 错 划 分 为 背景 和 把 背景 错 划 分 为 目标 的 两 种 情况 进行 了 
区 分 ,而 后 者 没有 进行 这 样 的 区 分 。 不 过 ,实际 上 两 者 的 数值 只 会 差 个 比例 系数 。 从 图 像 分 
析 的 角度 看 ,是 两 种 情况 的 综合 结果 导致 对 目标 测量 的 误差 。 需 要 指出 ,最 终 测量 精度 可 采 
用 不 同 的 特征 ,从 不 同 的 应 用 目的 来 衡量 算法 的 具体 效果 ,使 用 起 来 更 加 灵活 方便 。 


9-15 分割 评 价 实验 


名 题 面 : 

生成 一 幅 有 一 个 不 规则 目标 的 图 像 , 释 加 一 定 的 噪声 后 用 阅 值 化 方法 进行 分 割 。 对 比 
原始 图 像 和 分 割 图 像 ,借助 计算 像素 距离 误差 来 判断 间 值 选取 对 分 割 结果 的 影响 。 通 过 改 
变 琶 加 的 噪声 强度 ,看 看 像素 距离 误差 如 何 变 化 。 

气 解析 : 

所 构造 的 原始 图 像 ( 目 标的 内 外 轮廓 都 不 太 规则 ) 和 直接 对 它 用 冰 值 分 割 方法 得 到 的 结 
果 分 别 见 图 解 9-15(1a) 和 图 解 9-15(1b)。 可 见 在 没有 品 声 时 , 阅 值 分 割 的 结果 能 反映 轮廓 
上 的 各 个 细节 。 





(a) (b) 
图 解 9-15(1) ”原始 图 像 和 分 割 图 像 


于 加 高 斯 噪声 后 的 一 些 图 像 如 图 解 9-15(2) 所 示 , 其 中 不 同 的 信 噪 比 指示 了 噪声 干扰 
的 强度 。 直 观 地 看 , 随 着 噪声 的 增加 ,目标 与 背景 的 区 别 变 得 不 清晰 了 ,轮廓 也 不 连续 了 。 





信 噪 比 0.309 信 噪 比 0.345 信 噪 比 0.382 
图 解 9-15(2) ” 释 加 高 斯 噪声 的 图 像 


“有 


对 上 述 秋 加 了 不 同 强度 高 斯 噪声 的 图 像 使 用 阅 值 化 方法 进行 分 割 得 到 的 图 像 如 
图 解 9-15(3) 所 示 。 信 品 比 越 低 的 图 像 分 割 效 果 越 差 ,与 预想 的 一 致 。 


[al fa 


信 噪 比 0.0909 信 品 比 0.127 信 噪 比 0.164 








信 噪 比 0.309 比 0.345 信 噪 比 0.382 


图 解 9-15(3) 对 乔 加 高 斯 噪声 图 像 的 分 割 结 果 


接 下 来 计算 各 图 中 的 像素 距离 误差 ,这 里 选择 了 归 一 化 距离 测度 (NDM) 这 个 指标 。 所 
得 到 的 NDM- 信 噪 比 曲线 如 图 解 9-15(4) 所 示 。 
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图 解 9-15(4) ”NDM- 信 品 比 曲线 














从 如 图 解 9-15(4) 所 示 的 曲线 可 以 发 现 , 随 着 琶 加 噪声 强度 的 增加 , 国 值 分 割 算法 的 分 
割 结果 不 断 变 差 , 归 一 化 距离 测度 的 数值 也 不 断 增加 , 即 像素 距离 误差 也 不 断 增加 ,这 说 明 
归 一 化 距离 测度 确实 能 够 反映 图 像 的 分 割 质量 。 


» Sa 





在 图 像 分 析 中 ,对 目标 的 表达 和 描述 是 图 像 分 割 之 后 又 一 个 重要 步骤 。 图 像 分 割 将 图 
像 中 令 人 感 兴趣 的 区 域 ( 即 目标 ) 提 取出 来 。 为 有 效 地 刻画 目标 ,需要 采用 合适 的 数据 结构 
对 它们 进行 表达 ,采用 恰当 的 形式 描述 它们 的 特性 ,并 在 此 基础 上 进行 特征 测量 ,从 目标 获 
得 一 些 定量 的 特性 数值 以 进行 分 析 , 并 进一步 实现 对 目标 的 识别 ,分 类 等 。 

对 目标 的 表达 需要 借助 合适 的 数据 结构 来 进行 。 目 标 在 图 像 中 对 应 区 域 ,对 区 域 既 可 
用 其 内 部 (如 组 成 区 域 的 像素 集合 ) 表 示 , 也 可 用 其 外 部 (如 组 成 区 域 边界 的 像素 集合 ) 表 示 。 
一 般 来 说 ,如 果 比 较 关 心 的 是 区 域 的 反射 性 质 ,如 灰 度 、 颜 色 、 纹 理 等 , 常 选用 内 部 表达 法 ，; 
如 果 比 较 关 心 的 是 区 域 的 形状 等 , 则 常 选用 外 部 表达 法 。 另 外 ,对 目标 的 表达 既 可 在 图 像 空 
间 进 行 ,也 可 在 各 种 变换 空间 进行 。 

在 对 目标 的 表达 基础 上 ,可 以 对 目标 进行 描述 。 表 达 是 直接 具体 地 表示 目标 数据 ,描述 
则 是 要 较 抽象 地 表示 目标 特性 。 好 的 描述 应 在 尽 可 能 区 别 不 同 目标 的 基础 上 对 目标 的 尺 
度 ,平移 ,旋转 等 变化 不 敏感 ,以 使 对 目标 的 描述 更 为 通用 。 描 述 也 可 分 为 对 边界 的 描述 和 
对 区 域 的 描述 。 除 此 之 外 ,在 图 像 中 有 多 个 目标 时 ,对 边界 和 边界 或 区 域 和 区 域 之 间 的 关系 
也 常常 需要 进行 有 效 的 描述 。 

对 目标 的 描述 常 借助 一 些 称 为 目标 特征 的 描述 符 来 进行 。 获 得 图 像 中 目标 特征 的 定量 
数值 是 图 像 分 析 的 一 个 主要 目的 。 要 借助 特征 来 提取 图 像 中 的 客观 信息 ,需要 解决 两 个 关 
键 问 题 : 其 一 是 选用 什么 特征 来 描述 目标 ; 其 二 是 如 何 精确 地 测量 这 些 特征 。 

对 目标 特征 的 测量 从 根本 上 来 说 是 要 从 数字 化 的 数据 中 去 精确 地 估计 产生 这 些 数 据 的 
模拟 量 的 性 质 。 因 为 这 是 一 个 复杂 的 估计 过 程 ,所 以 误差 是 不 可 避免 的 。 这 里 误差 指 测量 
数据 和 真实 数据 之 间 的 差别 ,其 中 真实 数据 常常 是 对 一 个 测量 实验 的 期 望 结果 (有 时 是 用 其 
他 方法 获得 的 )。 另 外 ,在 这 个 估计 过 程 中 还 有 许多 因素 会 影响 特征 测量 的 准确 性 和 精确 
性 ,所 以 还 需要 研究 导致 误差 产生 的 原因 并 设法 减 小 各 种 因素 的 影响 。 

本 章 的 问题 涉及 上 述 目标 表达 和 描述 多 个 方面 的 概念 。 


10-1 基于 聚合 和 基于 分 裂 的 最 小 均 方 误差 线段 逼近 法 


名 题 面 : 

在 多 边 形 和 逼近 中 ,对 同一 个 轮廓 分 别 用 基于 聚合 的 最 小 均 方 误 差 线段 通 近 法 和 基于 分 
有 裂 的 最 小 均 方 误差 线段 各 近 法 得 到 的 两 个 多 边 形 有 可 能 是 一 样 的 。 但 在 一 般 情况 下 ,用 这 
两 种 方法 从 同一 个 轮廓 得 到 的 多 边 形 并 不 一 样 。 试 列举 几 个 不 一 样 的 原因 。 


气 解析 : 

这 里 给 出 两 个 导致 两 种 方法 结果 不 同 的 因素 : 

(1) 在 使 用 基于 分 裂 的 方法 来 构建 多 边 形 时 总 是 连接 相距 最 远 的 两 个 点 (点 对 ) ,这 种 
点 对 一 般 是 唯一 的 ,所 以 结果 会 比较 稳定 ; 但 用 基于 聚合 的 方法 来 构建 多 边 形 时 起 点 可 任 
意 选 ,如 果 起 点 选 得 不 一 样 ,聚合 的 顺序 不 同 , 则 最 终 得 到 的 多 边 形 的 形状 就 可 能 会 有 很 多 

(2) 基于 聚合 的 方法 在 逼近 多 边 形 上 各 点 的 时 候 是 依次 进行 的 ,确定 后 一 个 点 会 受到 
前 一 个 已 经 确定 点 的 位 置 的 影响 ; 而 基于 分 裂 的 方法 在 构建 多 边 形 的 过 程 中 只 考虑 两 个 点 
之 间 的 距离 ,这 种 影响 就 比较 小 了 。 

本 质 上 讲 , 基 于 分 裂 的 方法 依次 寻求 全 局 最 优 ,而 基于 聚合 的 方法 主要 考虑 了 局 部 
最 优 。 


10-2 ” 正 五 角形 的 外 接合 和 最 小 包围 长 方形 


各 题 面 : 

给 定 一 个 正 五 角形 , 试 分 别 做 出 它 的 各 个 朝向 的 外 接合 和 最 小 包围 长 方形 。 

扣 解 析 : 

用 长 方形 来 (最 紧凑 地 ) 包 围 五 角形 一 共有 5 种 (对 称 的 ) 可 能 , 即 长 方形 有 一 条 边 与 五 
角形 的 两 个 顶点 相 切 而 其 余 3 条 分 别 与 另 3 个 顶点 相 切 。 所 以 最 小 包围 长 方形 一 共有 5 个 
(面积 相同 ) ,如 图 解 10-2 中 各 个 实 线 框 所 示 ,其 中 底 边 与 两 个 项 点 相 切 得 到 的 最 小 包围 长 
方形 也 就 是 五 角形 的 外 接 盒 ( 即 图 中 最 上 面 的 那个 ) 。 对 其 他 4 个 外 接 盒 ,在 图 解 10-2 中 用 
虚线 框 表示 ,可 见 它们 的 尺寸 都 大 于 对 应 的 最 小 包围 长 方形 。 





图 解 10-2 正 五 角形 的 外 接合 和 最 小 包围 长 方形 


8 Js 


10-3 方 和 圆 的 标记 及 形状 描述 符 


各 题 面 : 

给 定 一 个 边 长 为 1 的 正方 形 和 一 个 直径 为 1 的 圆 形 : 

(1) 要 将 它们 区 分 开 ,需要 使 用 几 个 形状 描述 符 ? 举例 说 明 。 

(2) 分 别 做 出 它们 基于 距离 为 弧 长 的 函数 的 标记 。 要 将 这 两 个 标记 区 分 开 , 需 要 几 个 
描述 符 ? 

气 解析 

(1) 要 将 正方 形 和 圆 形 区 别 开 , 只 需 一 个 形状 描述 符 即 可 。 例 如 ,使 用 形状 参数 描述 符 
( 圆 形 的 值 为 1 ,而 正方 形 的 值 大 于 1); 用 偏心 率 描述 符 ( 圆 形 所 对 应 的 两 个 半 轴 长 相等 ,而 
正方 形 所 对 应 的 两 个 半 轴 长 不 相等 ); 用 球状 性 描述 符 ( 圆 形 的 值 为 1, 而 正方 形 的 值 小 于 
1); 用 圆 形 性 描述 符 ( 圆 形 的 值 要 大 于 正方 形 的 值 ) 等 。 

(2) 它们 基于 距离 为 弧 长 的 函数 的 标记 分 别 如 图 解 10-3(Ca) 和 图 解 10-3(b) 所 示 。 











图 解 10-3 正方形 和 圆 形 的 标记 


要 将 这 两 个 标记 区 分 开 , 也 只 需 一 个 描述 符 即 可 。 例 如 ,用 标记 的 长 度 ( 对 应 圆 形 的 标 
记 为 直线 ,所 以 长 度 较 短 ; 而 对 应 正方 形 的 标记 为 曲线 ,所 以 长 度 较 长 ) .曲率 (对 应 圆 形 的 
标记 为 直线 ,所 以 曲率 为 零 ; 而 对 应 正方 形 的 标记 为 曲线 ,所 以 曲率 较 大 ) 等 。 


10-4 ”长 方形 和 椭圆 的 形状 描述 符 


握 题 面 : 

试 计算 下 列 目标 的 形状 描述 符 : 圆 形 性 C, 偏 心率 已 ,形状 因子 下 ,球状 性 S。 

(1) 长 为 2、 宽 为 1 的 长 方形 。 

(2) 长 轴 为 2、 短 轴 为 1 的 椭圆 形 。 

扣 解 析 : 

(1) 如 图 解 10-4(1) 建 立 长 方形 的 坐标 系 。 

计算 圆 形 性 : 利用 目标 的 对 称 性 , 仅 考 虑 第 一 象限 中 的 
阴影 部 分 , 先 计算 平均 距离 和 距离 的 均 方差 : 

1 2 下 i er 
£ ml VY Frdy+| 沁 +( jd 








图 解 10-4(1) 坐标 系 中 的 长 方形 
& 证 1 人 着 


6 | Hac +y5) |~ osa9 72 














1/2 | 
es 本 你 正本 | dy+| [VE F072 -A a) = Ep 
所 以 , 圆 形 性 
C= 入 3.9645018 


计算 偏心 率 : 先 算得 两 个 转动 惯量 A 和 B、 惯 性 积 昌 以 及 惯量 椭圆 的 两 个 半 主 轴 长 


(p 和 9g): 
1 1/2 出 
A = yazdy 一 4 +al ydy| 一 二 
0 0 6 
1 1/2 
B= [earay 一 4 zdzx 
0 0 


H=0, p=/, g= V2 


2 
i 
了 一 二 


所 以 ,偏心 率 EF=2。 
计算 形状 因子 : 


F—= Bl’ _ (C6) 9 
4rA 4r(2) 2r 











A 1.432 3945 
计算 球状 性 
S EL 1 
re Vi+(1/2)” V5 
(2) 如 图 解 10-4(2) 所 示 建 立 椭圆 的 坐标 系 。 
计算 圆 形 性 : 利用 目标 的 对 称 性 , 仅 考 虑 第 一 象限 
中 的 阴影 部 分 , 先 计算 平均 距离 和 距离 的 均 方 差 ( 式 中 
E(。,。，。) 为 椭圆 函数 ): 


= 二 | ”VS co = “(V3 x 
= a* sin’0++ 6b cos 0d0 一 a XE 人 














0.4472136 





二 中 和 
= X1.2111 ~ 0.77101 0 六 和 这 标 采 让 本 本 国 允 


/2 
2 2 a - je 2 0.030 543 
所 以 , 圆 形 性 : 











C= 笃信 4 4116398 
计算 偏心 率 : 这 里 目标 本 身 就 是 椭圆 形 的 ,所 以 偏心 率 下 一 2。 











计算 形状 因子 : 
IBl? {x[l.5C(at+)— VaB]) _ (2.25— V0.5) 
Ee A dx(abn) 8 aM 
计算 球状 性 : 
i 
5S= 一 = 也 ==0.5 


Es 


10-5 傅 里 时 描述 符 


名 题 面 : 
哪些 形状 类 型 的 目标 边界 的 傅 里 时 描述 符 中 只 有 实数 项 ? 
名 解析 : 
目标 边界 的 傅 里 叶 描 述 符 可 表示 为 
N=-1 
S(w) = 2 sk)exp[— j2rwk/N] w=0,1,.*, N—1 
k=0 


其 中 边界 序列 为 





s(k) = ulk)+jv(k) k=0,1,.%, N—1 
将 S(w) 的 表达 式 展开 ,得 到 
N=-1 
S(w)= 方 之 [wx(R) 十 juCR)][Lcos(2rzR/N) — jsin(2xuk/N)] 


k=0 
1 Nl 

= N22 uk) cos(2ruk/N) 十 uCk)sin(2rz/N)] 一 
k=0 


j[u(k)sin(2xwk/N) — wv(k)cos(2xwk/N)] 
由 上 可 见 , 如 果 下 式 满足 
ul(k)sin(2xwk/N) = v(k)cos(2xuk/N) w=0,1,., N—l;k=0,1,.…, 太一 1 
则 傅 里 叶 描 述 符 中 只 有 实数 项 。 这 表明 ;(k) 应 该 关于 原点 对 称 ,或 可 称 为 圆周 共 思 对称 
( 实 部 偶 对 称 , 虚 部 奇 对 称 )。 


10-6” 阶 为 10 的 所 有 形状 及 它们 的 形状 数 


名 题 面 : 

试 画 出 阶 为 10 的 所 有 形状 ,并 给 出 它们 的 形状 数 。 

名 解析 : 

阶 为 10 的 所 有 形状 一 共有 32 种 。 考 虑 到 对 称 性 ,共有 6 种 不 同 的 形式 ,如 图 解 10-6 
所 示 。 其 中 第 1 种 和 第 6 种 关于 X 轴 和 YY 轴 都 对 称 , 所 以 各 可 有 2 种 变形 ( 转 1 次 90"); 第 
3 种 关于 Y 轴 对 称 ,所 以 可 有 4 种 变形 (依次 转 4 次 90"), 第 2 种、 第 4 种 和 第 5 种 关于 X 轴 
和 YY 轴 都 不 对 称 ,所 以 各 有 8 种 变形 (依次 转 4 次 90" ,再 取 X 轴 或 Y 轴 的 镜像 ,还 可 依次 转 
4 次 90")。 它 们 的 形状 数 标 在 形状 下 面 ,形状 数 不 受 各 种 变形 的 影响 , 即 对 同一 种 形状 是 一 
样 的 。 


一 一 
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图 解 10-6 ” 阶 为 10 的 形状 
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10-7 欧 拉 数 计算 


气 题 面 : 
图 题 10-7 给 出 的 单位 网 格 图 像 中 有 一 些 简 单 的 目标 。 试 计算 它们 的 欧 拉 数 ( 包 括 4- 
连通 欧 拉 数 和 8- 连 通 欧 拉 数 ) 。 











图 题 10-7 ”一 些 单位 网 格 图 像 





如 解析 : 
各 个 目标 的 4- 连通 欧 拉 数 和 8- 连通 欧 拉 数 如 表 解 10-7 所 示 。 
表 解 10-7 ” 欧 拉 数 计算 结果 














欧 拉 数 (a) (b) (c) (Cd) (e) (f) (g) (h) 
E, 1 1 10 10 2 2 2 2 
Es 1 | 一 3 一 3 0 0 0 0 























10-8 不 变 矩 的 形状 区 分 能 力 


名 题 面 : 

图 题 10-8 的 两 图 中 间 各 有 一 个 白色 和 矩形 
目标 ,尺寸 均 为 161X101 像素 。 右 边 图 中 目 
标 中 间 上 方 还 多 一 个 有 25 个 像素 的 三 角形 。 
讨论 采用 7 个 不 变 矩 作为 形状 描述 符 是 否 能 
区 分 它们 。 

名 解析 : 图 题 10-8 ”两 个 矩形 目标 

直接 对 两 个 目标 计算 7 个 不 变 矩 得 到 的 结果 见 表 解 10-8(1) 。 其 中 ,相对 误差 是 两 目标 
的 相同 矩 的 绝对 差 与 左 目 标 该 矩 的 百分比 ,体现 了 该 矩 对 目标 的 区 分 度 。 

表 解 10-8(1) 对 原始 目标 计算 7 个 不 变 矩 得 到 的 结果 


























不 变 气 左 目标 右 目 标 相对 误差 
T 0.185 105 467 068 446 0. 184 662 802 290 308 0.239% 
T; 0.006 490 050 732 561 0. 006 373 257 149 467 1.80% 
Ts; 0 1. 375 986 605 417 057 e-07 = 
和 0 1.179 193 864 978 971 e-08 “> 
T; 0 一 4.749 904 956 193 523 e-16 = 
T 0 一 9.413 820 909 145 556 e-10 = 
T; 0 1.668 749 462 992 892 e-29 em 
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大 。 








加 上 相同 的 
解 10-8 所 示 。 


对 图 解 10-8 的 两 个 目标 





ss 


随机 线条 ,得 到 的 结果 如 图 人 


WGH 





于 次 计算 7 个 不 











表 解 10-8(1) 可 见 , 两 目标 的 不 变 矩 Ti 和 了 都 有 一 点 不 同 , 但 它们 的 区 分 度 都 不 很 
于 左边 目标 的 不 变 矩 T, 到 T; 都 为 零 ,所 以 无 法 定量 计算 相对 误差 。 

这 个 问题 源 于 左边 目标 的 规则 性 和 对 称 
性 。 为 此 ,可 在 左边 目标 上 加 些 随机 线条 ( 背 
景 ) 来 改变 其 规则 度 和 对 称 度 ,对 右边 目标 也 





图 解 10-8 改变 后 的 两 个 矩形 目标 




















变 矩 ,得 到 的 结果 见 表 解 10-8(2) 。 
表 解 10-8(2) 对 改变 后 的 目标 计算 7 个 不 变 矩 得 到 的 结果 

不 变 矩 左 目 标 右 目 标 相对 误差 
全 0.276 735 651 677 607 0. 275 708 761 061 961 0.371% 
TT; 0.013 778 832 096 845 0.013 445 609 340 627 2.42% 
Ts 3.451 461 507 263 788 e-05 2.616 062 867 249 313 e-05 24.2% 
T, 8.776 696 877 690 011 e-06 9.562 044 144 358 251 e-06 8.95% 
T; 一 1.460 944 367 020 617 e-10 一 1. 205 275 061 508 134 e-10 17.5% 
Te 6.539 957 941 311 158 e-07 5. 392 559 809 012 624 e-07 17.5% 
T 一 4.461 837 196 428 809 e-11 一 9.135 055 374 071 875 e-11 105% 














由 表 解 10-8(2) 可 见 , 不 变 矩 T 到 T; 具有 对 两 个 新 目标 比 T 到 T, 更 大 的 区 分 度 。 


各 题 面 : 


如 图 题 10-9 所 示 ,给 


小 凸 起 ) 。 


10-9 描述 符 的 形状 区 分 能 力 








图 题 10-9 两 个 示例 目标 


力 ,比如 下 面 的 几 个 描述 符 。 


长 度 : 右 
曲率 : 左 
起 部 分 也 有 曲 
形状 数 : 





图 目标 上 方 的 凸 起 部 分 会 增加 轮廓 长 度 ( 大 于 左 图 目标 的 轮廓 长 度 ); 


(1) 指出 采用 哪些 边界 描述 符 ,利用 
算数 值 就 可 以 较 好 地 区 分 它们 。 

(2) 指出 采用 哪些 区 域 描 述 符 , 利 用 计 
算数 值 就 可 以 较 好 地 区 分 它们 。 


(1) 有 多 个 边界 描述 符 都 具有 这 样 的 








图 目标 的 轮廓 曲率 仅 在 长 方形 的 4 个 顶点 处 发 生变 化 ,而 右 
率 的 变化 ; 


两 个 目标 的 轮廓 链 码 不 同 , 所 以 阶 数 较 大 的 形状 数 也 会 有 所 不 同 





另外 ,由 图 题 10-9 可 直接 看 出 ,两 个 目标 的 骨架 表达 有 很 大 不 同 , 所 以 可 


骨架 (如 计算 骨架 的 长 度 ) 来 区 分 目标 。 


ww 20) 全 


图 


定 了 两 个 形状 相近 但 骨架 相差 较 多 的 长 方形 目标 ( 右 图 中 部 有 个 


计 


能 





目标 上 方 的 凸 





[考虑 通过 区 分 


(2) 有 多 个 区 域 描述 符 都 具有 一 定 的 能 力 , 比 如 下 面 的 几 个 描述 符 。 

面积 : 右 图 目标 的 面积 会 大 于 左 图 目标 的 面积 ,但 如 果 像 素 网 格 过 大 ,差距 有 可 能 被 
忽略 ; 

重心 : 右 图 目标 的 重心 会 比 左 图 目标 的 重心 更 高 ,不 过 差别 可 能 不 很 明显 ; 

男 外 还 有 一 些 形状 描述 符 (如 外 观 比 ,形状 因子 等 ) 具 有 一 定 的 区 分 能 力 ,但 是 拓扑 描述 
符 显然 不 适合 用 在 此 处 。 

总 体 来 说 ,因为 区 分 主要 体现 在 局 部 区 域 ,所 以 采用 边界 描述 符 比 区 域 描述 符 应 具有 更 
好 和 更 细 的 描述 能 力 。 


10-10 ”随机 点 分 布 的 泊 松 概率 和 高 斯 概率 


名 题 面 : 

假设 在 平面 上 分 布 着 一 些 随机 点 ,在 单位 面积 中 的 随机 点 数 的 平均 值 是 10， 

(1) 计算 当 实 际 点 数 为 0, 1, …， 20 情况 下 的 泊 松 概率 p(x) 二 10"e /li; 

(2) 计算 当 实 际 点 数 为 0， 1，…，20 情况 下 的 高 斯 概率 g (n) 二 [1/(20x)'*] 
exp{—[(n—10)?/20]; 

(3) 比较 两 种 分 布 的 总 体 情况 并 讨论 。 

所 解析 : 

(1) 对 泊 松 概率 的 计算 结果 如 表 解 10-10(1) 所 示 。 


表 解 10-10(1) ” 泊 松 概率 











n 0 1 2 3 4 5 6 7 8 旬 10 
pln) 0 0 0.002 | 0.008 | 0.019 | 0.038 | 0.063 | 0.09 | 0.113 | 0.125 0.125 
n 11 12 13 14 15 16 17 18 19 20 






































pln) 0.114 | 0.095 | 0.073 | 0.052 | 0.035 | 0.022 | 0.013 | 0.007 | 0.004 | 0.002 


(2) 对 高 斯 概率 的 计算 结果 如 表 解 10-10(2) 所 示 。 
表 解 10-10(2) ”高 斯 概率 
n 0 1 2 3 4 5 6 村 8 9 10 





pln) 0.001 | 0.001 | 0.005 | 0.011 | 0.021 | 0.036 | 0.057 | 0.08 | 0.103 | 0.12 0.126 








n 11 12 13 14 15 16 17 18 19 20 



































pln) 0.12 | 0.103 | 0.08 | 0.057 | 0.036 | 0.021 | 0.011 | 0.005 | 0.002 | 0.001 


(3) 将 两 组 概率 值 都 画 成 曲线 ,如 图 解 10-10 所 示 。 通 过 比较 ,可 见 泊 松 概率 值 的 曲线 
是 左右 不 对 称 的 ,而 高 斯 概率 值 的 曲线 是 左右 对 称 的 。 不 过 ,两 组 概率 值 很 接近 , 即 两 个 分 
布 相当 接近 ,最 大 的 区 别 不 到 0.01。 其 中 ,在 [0, 4] 和 [10, 15] 区 间 时 高 斯 概率 值 略 大 于 泊 
松 概率 值 ,而 在 [5, 10] 和 [16, 20] 区 间 时 高 斯 概率 值 略 小 于 泊 松 概率 值 。 但 需要 注意 , 实 
际 中 每 个 单位 区 域 只 取 10 个 点 来 计算 分 布 还 是 比较 不 足 的 。 
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0.1 200 000 
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0.0 800 000 
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0.0 400 000 
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0.0 000 000 - 上 1 
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一 - 泊 松 概率 ~ 人- 高 斯 概率 
图 解 10-10” 泊 松 概 率 和 高 斯 概率 图 解 10-10 
10-11 组 合 有 向 线段 
亏 题 面 : 


借助 字符 串 描 述 ,组 合 图 题 10-11(1) 中 的 4 个 基本 有 向 线段 以 分 别 构成 如 图 题 10-11(2) 
所 示 的 4 个 结构 ,并 给 出 它们 对 应 的 组 合 表达 式 。 


图 题 10-11(1) 基本 有 向 线段 


dtp 


图 题 10-11(2) 构建 结构 








各 解析 : 
用 a 表示 a 的 反 向 ,bw 表示 4b 的 反 向 ,c 表示 < 的 反 向 ,d' 表 示 d 的 反 向 , 则 有 
第 1 图 : [(cXd)*6b+a] 一 (a 二 +b); 

第 2 图 ; (a 十 6) *[a+(d—c) *6b]; 

第 3 图 : {[Cc' 十 d) *a’] 二 (ba)} xas 

第 4 图 : {(6 十 a) 二 [Cc+d’) x*a’]}*a。 


10-12 3-D 图 像 中 的 连通 悖 论 


























部 题 面 : 
举例 说 明 在 3-D 图 像 中 也 有 连通 悖 论 的 问题 。 
要 解析 ， 
考虑 一 个 5X5X5 像素 的 立体 网 格 中 沿 XX 轴 、Y 轴 和 ZZ 轴 都 对 称 的 中 空 目 标 。 如 果 将 
其 沿 Z 轴 切 成 5 层 , 则 各 层 如 图 解 10-12 所 示 。 
如 果 对 目标 和 背景 都 使 用 6- 连 通 来 判断 , 则 目标 成 为 互 不 连通 的 18 个 小 立方 体 。 如 
“ 22 a 





= 唱 电 中 中 


图 解 10-12 目标 的 5 层 


果 对 目标 和 背景 都 使 用 18- 连 通 来 判断 , 则 目标 中 的 空 腔 会 与 背景 连通 。 这 就 出 现 了 连通 
悖 论 的 问题 。 解 决 的 方法 就 是 对 目标 使 用 18- 连 通 ,而 对 其 内 部 和 外 部 背景 使 用 6- 连 通 。 
也 可 以 对 目标 使 用 26- 连 通 ,而 对 其 内 部 和 外 部 背景 仍 使 用 6- 连 通 。 


10-13 直线 长 度 的 计算 


各 题 面 : 

对 直线 长 度 的 计算 可 以 采取 多 种 方法 。 一 方面 可 对 直线 用 链 码 表示 , 则 链 码 长 度 区 可 
以 用 下 列 通 式 计算 CN。 为 偶数 链 码 的 个 数 , N。 为 奇数 链 码 的 个 数 ,N。 为 角 点 的 个 数 ) 

L=AXN.+BxN,.+CxN. 

式 中 ,A、B、C 是 加 权 系数 。 在 取 C=0 的 公式 中 ,最 常用 的 是 取 A==1 和 B 二 1.414( 平 均 相 
对 均 方 根 误差 为 6.6%); 更 准确 一 点 的 公式 中 取 A 二 0. 948 和 B= 二 1. 343( 平 均 相 对 均 方 根 
误差 为 2.6%)。 

另 一 方面 ,也 可 使 用 基于 局 部 距离 的 模板 来 计算 直线 的 长 度 。 一 种 典型 的 模板 如 
图 题 10-13 所 示 ,其 中 一 0.955 09,0 王 1. 369 30。 





请 用 上 述 局 部 距离 模板 和 两 个 链 码 长 度 公式 计算 一 个 两 条 直 六 汉 
角 边 长 度 分 别 为 3 个 像素 和 5 个 像素 的 三 角形 的 斜 边 直线 的 长 a 0 4a 
度 ,并 以 欧 氏 距离 为 参考 ,计算 它们 的 相对 误差 。 bp a 4 
气 解析 : 图 题 10-13 ”局 部 距离 模板 


4 种 方法 计算 的 结果 如 表 解 10-13 所 示 。 
表 解 10-13 4 种 方法 计算 直线 长 度 得 到 的 结果 























序 号 方 法 直线 长 度 相对 误差 
1 链 码 长 度 (A=1,B=1.414) 6.242 7.049% 
2 链 码 长 度 (A 一 0. 948,B 一 1.343) 5. 925 1.612% 
3 局 部 距离 模板 6.018 3.207% 
4 欧 氏 距离 5. 831 0% 


10-14 离散 距离 ds,; 的 最 大 相对 误差 


名 题 面 : 
如 果 用 ds,? 作 为 离散 距离 来 代替 欧 氏 距离 ,所 产生 的 最 大 相对 误差 是 多 少 ? 





» 2 


可 解析 : 
因为 a==s 二 5,6 二 7, 所 以 代入 公式 : 





























本 要 FE 2 
世人 琴 二 二 | 要 一 种 ,| 二 区 一 光 0 
有 2s 
| SEY 和 
= max| 5 邮 | 生 5 夯 











一 max{0， 7.70%， 


w 和 


1%}= 7.70% 











特性 分 析 是 在 提取 出 目标 ,对 其 进行 了 有 效 的 表达 和 描述 ,并 获得 基本 特征 的 基础 上 ， 
从 视觉 感知 的 角度 ,把握 目标 的 各 类 特性 ,在 较 高 的 抽象 层次 刻画 目标 和 辨识 目标 。 描 述 目 
标 并 进而 描述 景物 可 使 用 许多 方面 的 特征 ,如 灰 度 特征 、 颜 色 特 征 、 纹 理 特 征 、 形 状 特征 、 显 
著 性 特征 、 运 动 特征 、 属 性 特征 、 结 构 特征 、 空 间 特征 等 。 灰 度 特征 和 颜色 特征 多 在 图 像 处 理 
中 讨论 ,结构 特征 和 空间 特征 常 在 图 像 理 解 中 讨论 。 

纹理 是 物体 表面 的 固有 特征 之 一 ,因而 也 是 图 像 区 域 的 一 种 重要 属性 。 对 图 像 中 纹理 
特性 的 研究 工作 包括 对 纹理 的 表达 和 描述 (所 用 的 方法 主要 有 3 类 : 统计 法 结构 法 、 频 谱 
法 ) ,借助 纹理 性 质 对 纹理 图 像 的 分 割 (包括 有 监督 分 割 和 无 监督 分 割 ), 对 纹理 图 像 的 分 类 
和 合成 以 及 从 纹理 变化 恢复 景物 形状 。 

形状 是 物体 的 一 个 重要 特性 , 常 借助 形状 描述 符 进行 描述 。 对 形状 的 描述 和 分 析 常 
采用 3 类 方法 : 特征 的 方法 (用 特征 描述 形状 特性 ); 形状 变换 的 方法 (借助 从 一 种 形状 
转换 为 男 一 种 形状 的 参数 模型 ); 基于 关系 的 方法 (将 复杂 形状 分 解 成 简单 基 元 , 既 描 述 
基 元 自身 性 质 也 描述 基 元 之 间 的 相对 关系 )。 对 形状 的 分 析 应 该 基于 形状 的 性 质 以 及 可 
用 的 理论 和 技术 。 从 一 方面 来 说 ,一 个 形状 性 质 可 用 基于 不 同 理论 和 技术 的 描述 符 来 描 
述 ; 从 另 一 方面 来 说 ,借助 同一 种 理论 和 技术 也 可 以 获得 不 同 的 描述 符 以 刻画 目标 形状 
的 不 同 特性 。 

目标 在 图 像 中 的 显著 性 与 主观 感知 相关 联 , 反 映 了 多 种 底层 特性 的 综合 影响 。 相 比 颜 
色 、 纹 理 , 形 状 等 目标 特性 ,显著 性 与 生理 学 和 心理 学 的 结合 更 加 紧密 。 对 人 的 不 同感 官 ,有 
不 同 的 感知 显著 性 。 图 像 分 析 关 注 的 是 与 视觉 器 官 相关 的 视觉 显著 性 。 图 像 中 显著 极 值 的 
提取 通常 是 实施 选择 性 注意 机 制 的 关键 步骤 。 

目标 的 运动 情况 也 是 物体 的 一 个 重要 特性 , 常 需要 使 用 图 像 序列 (如 视频 ) 来 进行 分 
析 。 运 动 导 致 的 景物 变化 会 使 图 像 的 灰 度 或 灰 度 空间 分 布 发 生变 化 。 这 些 变化 既 可 对 
应 景 的 变化 (外 在 照明 改变 、 视 场 改变 等 ) ,也 可 对 应 物 的 变化 (目标 位 置 和 朝向 改变 ) 。 
检测 这 些 变化 的 方式 方法 有 许多 种 ,包括 对 运动 目标 的 检测 和 提取 ,也 包括 对 运动 目标 
的 跟踪 和 分 割 。 

属性 在 中 层 语义 层次 反映 了 目标 特定 的 特性 ,在 其 命名 上 也 体现 了 人 的 主观 性 。 属 性 
是 一 个 比较 广泛 的 概念 ,前面 讨 论 过 的 景物 的 亮度 、 颜 色 、 纹 理 、 形 状 ` 运 动 等 特性 也 可 归 到 
广义 属性 下 。 狭 义 的 图 像 视觉 属性 是 指 可 以 由 人 指定 名 称 并 且 能 在 图 像 中 观察 到 的 特性 ， 
或 者 说 是 被 看 作 人 类 可 理解 以 及 机 器 可 检测 的 特性 ,常见 的 例子 是 似 物性 和 部 件 属性 。 

本 章 的 问题 涉及 上 述 特性 分 析 多 个 方面 的 概念 。 





11-1 灰 度 共生 矩阵 与 纹理 参数 


名 题 面 : 


选择 


个 纹理 描 
各 解析 


选择 Lena 图 像 ,图 解 1 


- 幅 实验 图 像 ,计算 它 的 灰 
上 述 各 个 共生 和 矩阵 ,分 别 计算 图 像 的 4 Se 符 ( 反 差 、 能 量 、 
述 符 的 均值 和 标准 差 。 


1 : 


共生 和 矩阵 Ma. Mo, 


Ma,» 、 
入 、 相 关 ) 的 值 ,3 


11-1(1) 中 从 左 向 右 依次 给 出 Ma,o Mo, 


Ma, 


5 图。 再 基于 





:给 出 各 


、Ma,v 、Ma,-v 图 。 





图 解 11-1(1) Lena 图 的 灰 度 共生 矩阵 图 
表 解 11-1(1) 给 出 对 4 个 纹理 参数 及 其 均值 和 标准 差 的 计算 结果 
表 解 11-1(1) ”Lena 图 的 纹理 参数 及 其 均值 和 标准 差 
标准 差 
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扣 解 析 2: 
选择 Cameraman 图 像 ， 


Ma, -5 图 。 
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图 解 11-1(2) 
表 解 11-1(2) 给 出 对 4 个 纹理 参数 及 其 均值 和 标准 差 的 计算 结果 。 








图 解 11-1(2) 中 从 左 向 右 依 次 





给 出 


~、 Mu, 


Ww A A 2 


Cameraman 图 的 灰 度 共生 和 矩阵 图 


»、~、 Ma,v、 





表 解 11-1(2) ”Cameraman 图 的 纹理 参数 及 其 均值 和 标准 差 
































纹理 参数 Ma.o Mo.» Ma.y» Ma.-» 均值 标准 差 
反差 304. 181 462. 941 632. 916 589. 902 497. 4849 147. 6957 
能 量 1. 48e7 1. 46e7 0. 29e7 0. 28e7 1. 3776e7 1. 0493e6 

0. 6356 0.6388 0. 6849 0. 6840 0.6608 0. 0273 
相关 0. 9489 0. 9223 0. 8636 0. 9011 0.9166 0.0247 


11-2 形状 因子 与 边界 的 连通 性 

要 题 面 : 

对 数字 图 像 , 试 证 明 : 

(1) 如 果 目 标 边界 是 4- 连 通 的 , 则 形状 因子 下 对 正 菱形 
目标 取 最 小 值 。 

(2) 如 果 目 标 边界 是 8- 连 通 的 , 则 形状 因子 下 对 正八 边 
形 目标 取 最 小 值 。 

名 解析 : 

(1) 先 考虑 目标 区 域 R 为 一 个 八 边 形 , 它 的 边界 用 B 表 
示 。 设 R 的 各 个 水 平和 竖 直 边 均 有 个 点 , 它 的 各 个 斜 边 均 
有 上 个 点 ,如 图 解 11-2(1) 所 示 。 

对 4- 连 通 边界 ,边界 长 度 为 

B, = 4(h—1)++4(k—1) 

区 域 R 的 面积 为 





图 解 11-2(1) ” 八 边 形 区 域 











A=[h+2(— DD 4 2 二 4h(k—1)+2(k— Dk—2) 
由 尺 的 面积 A 和 边界 长 B, 就 可 得 到 形状 因子 
,上 
i 


现在 寻找 能 使 下 最 小 的 R。 这 样 的 R 应 满足 以 下 两 个 条 件 : 

@ 给 RR 中 增加 点 不 会 使 F 减 小 ; 

@ 从 尺 中 删除 单个 点 不 会 使 下 减 小 。 

第 一 个 条 件 表明 下 应 该 是 有 限 的 ,例如 总 可 用 一 个 F<4/x 的 正方 形 来 包围 R。 第 一 
个 条 件 还 表明 R 应 当 为 单 连通 区 域 或 者 说 内 部 无 孔 。 因 为 如 果 R 有 孔 , 那 么 将 孔 填充 则 会 
增加 面积 A 但 不 会 增加 边界 长 度 B, 而 这 样 下 就 会 减 小 。 

现在 来 考虑 边界 点 的 各 种 情况 。 如 果 考 虑 到 旋转 和 镜面 反射 的 对 称 性 , 则 在 一 个 3X3 
的 区 域内 设 中 心 点 为 边界 点 ,那么 边界 点 及 其 8- 邻 域 最 多 共有 如 图 解 11-2(2) 所 示 的 9 种 
排列 情况 (其 中 p==1,g 二 0)。 


ololo|l [ololo|l [ololol [ololol lololo 
ofplol [olplol [lplol lolilol Da 
ofijol Do Do LU Da 


图 解 11-2(2) 边界 点 及 其 8- 邻 域 的 9 种 排列 情况 
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图 解 11-2(2) 中 的 前 3 种 情况 不 可 能 出 现 。 这 是 因为 如 果 从 R 中 将 p 删除 掉 将 使 A 
和 B 都 减 1。 但 是 ,对 足够 大 的 B, 有 <=4/x 二 (2B 一 1)/4x。 由 此 可 得 B: 一 2BA 十 A 一 0， 
这 样 就 有 B*A 一 2BA 十 A 二 BA 一 B? , 即 (B 一 1)*/(A 一 1) 过 F, 这 与 第 二 个 条 件 是 矛盾 的 。 

同 理 , 图 解 11-2(2) 中 的 后 3 种 情况 也 不 可 能 出 现 。 这 是 因为 如 果 在 R 中 将 gq 换 成 1， 
则 将 使 A 增加 但 并 不 改变 B, 所 以 下 会 减 小 ,这 与 第 一 个 条 件 是 蔬 盾 的 。 

这 样 一 来 ,只 有 图 解 11-2(2) 中 间 的 3 种 情况 可 能 出 现 。 rr 
它们 可 分 别称 为 凸 直角 、 凸 135 。 角 和 对 角 方 向 的 直线 边界 。 olililo 
对 凸 135" 角 的 情况 , 它 总 是 以 两 个 相同 的 角 紧 密 相连 的 形式 111111 
出 现 ,如 图 解 11-2(3) 所 示 ( 这 里 长 度 大 于 等 于 3 的 水 平和 垂 ”图解 11.2(3) 向 135* 角 的 情况 
直 边 界 段 都 不 考虑 ) 。 

综 上 所 述 ,R 只 可 能 有 如 图 解 11-2(4) 所 示 的 4 种 形式 ,它们 均 为 正 萎 形 (包括 有 倒 角 
退化 的 正 萎 形 )。 所 以 当 边 界 是 4- 连 通 时 形状 因子 下 对 正 菱形 区 域 取 最 小 值 。 































































































图 解 11-2(4) ”形状 因子 下 取 最 小 值 的 4 种 形式 


(2) 借助 上 面 的 讨论 考虑 8- 连 通 边界 。 如 果 对 8- 连 通 边 界 ,取水 平 或 垂直 段 长 度 为 1， 

对 角 线 长 度 为 V2 ,这 样 的 边界 长 为 
Bs 一 4(h 一 1) 十 4(R 一 1)V2 

面积 和 形状 参数 的 计算 公式 不 变 。 与 前 面 讨论 的 类 似 , 图 解 11-2(2) 的 9 种 情况 中 前 3 
种 情况 不 可 能 出 现 ,因为 从 R 中 将 p 删除 将 使 B 减少 ,从 而 减少 下 而 与 前 面 讨论 的 第 二 个 
条 件 矛 盾 。 

同 理 ,图 解 11-2(2) 里 的 第 8 和 第 9 两 种 情况 也 不 可 能 出 现 ,因为 将 g 换 成 1 仅 使 A 增 
加 但 并 不 改变 B, 所 以 下 会 减 小 ,这 与 第 一 个 条 件 是 矛盾 的 。 但 图 解 11-2(2) 中 的 第 7 种 情 
况 可 能 出 现 ,因为 将 g 换 成 1 不 仅 使 A 增加 1 也 使 B 增 加 2(V2 一 1), 所 以 对 大 的 B, 会 使 下 
增加 。 

图 解 11-2(2) 中 间 的 3 种 情况 仍 可 能 出 现 。 由 上 面 讨论 可 见 , 仅 有 有 限 种 (4 种 ) 形 式 的 
情况 是 允许 的 ,它们 均 为 八 边 形 。 换 句 话说 , 当 边 界 是 8- 连 通 时 能 使 形状 参数 下 最 小 的 RR 
应 是 八 边 形 ( 包 括 有 倒 角 退 化 的 八 边 形 ) 。 


11-3 曲线 曲率 的 计算 








名 题 面 : 
图 题 11-3 中 有 4 条 曲线 ,对 它们 分 别 进行 了 一 些 采样 。4 条 曲线 交 于 (7, 5) 点 ,分 别 计 
算 它们 在 各 采样 点 的 曲率 并 比较 它们 在 (7, 5) 点 的 曲率 。 
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图 题 11-3 ”相交 的 4 条 曲线 


如 解析 : 

先 写 出 4 条 线 上 各 采样 点 的 坐标 : 

liel, ls DS. 005 We 0 a DD 0s DL 

Lies (Cs Bs C2 TOs. Cdr by 7 Sys HOS Ds C2 TI es Ws 

ies 8: TIDs thy WB We DW C77 0 9 LE 

Haeds {C6, T0506 Wr ts Ws Ca Bs Vos DY, 

计算 4 条 线 上 各 采样 点 处 的 一 阶 和 二 阶 差分 值 ,得 到 : 

linel: X 方向 上 的 一 阶 差分 值 均 为 2 而 二 阶 差分 值 均 为 0,Y 方向 上 的 一 阶 和 二 阶 差分 
值 均 为 0; 

me = 内 差 汾 值 为 {05 005 Xs 一 用 一 下 《3 一 17 (3 WW;. (2 Ds; 
CL TINYs 





二 阶 差 分 什 为 {C0; 0)s tl 一 这 人， 芍 ; Ly 巩 ; (05 D5 (Ly0), (=L; 0 
lines; =— 恒 关 纵 盘 为 {(0% 0 1s 二 205. X13 二 2)5- X28 二 2)y 25 2 (CLs 2 
eo 





二 阶 差 欠 什 为 (C08 0)s (lL, 一 Ds C05 0)s Xl: Oy W085 和 Ds (一 Js0)s Ws Os 
line4; 一 阶 差分 值 为 {(0, 0), (1, 2), (1, 2), (1, 一 2), (1, 一 2)}，, 
二 阶 差分 值 为 {(0, 0), (1, 2), (0, 0), (1, 一 4), (0, 0)}。 

计算 4 条 线 上 各 采样 点 处 的 曲率 值 , 得 到 : 

linel: {0, 0, 0, 0), 即 所 有 点 曲率 都 为 0; 

line2: {0, 0.0894, 0.0316, 0.1897, 0.0894); 

line3: {0, 0, 0.0884, 0.3536, 0.1889); 

ia {O03 Oy —03578 0}s 

4 条 线 在 交点 处 曲率 的 绝对 值 依次 为 0、0.1897、0.3536、0.3578。 一 点 处 的 曲率 大 小 反 
映 了 曲线 在 该 点 的 弯曲 程度 。 上 述 4 条 线 在 (7, 5) 点 的 曲率 越 来 越 大 ,表明 4 条 线 在 该 点 
的 弯曲 程度 越 来 越 大 ,与 观察 图 题 11-3 的 直观 感觉 是 一 致 的 。 
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11-4 形状 的 判断 


气 题 面 : 0 

考虑 图 题 11-4 中 的 图 形 , 它 的 形状 是 更 接近 矩形 还 是 | 
更 接近 圆 形 呢 ? | 

解析: 

该 图 形 的 面积 为 A。 二 30。 该 图 形 的 最 小 包围 矩形 (外 
接 盒 ) 的 面积 为 A, 二 56。 该 图 形 的 最 小 包围 圆 形 ( 外 接 圆 ) 
的 面积 为 A. 二 53. 89。 这 样 ,该 图 形 与 矩形 的 相似 度 为 S. 一 
A。/A,=30/56=0.5357 ,而 该 图 形 与 圆 形 的 相似 度 为 S, 一 
A。/A. 二 30/53.89 二 0.5567。 可 见 , 该 图 形 在 形状 上 更 接近 
圆 形 。 








Ft 

















图 题 11-4 需 判 断 形状 的 图 形 


11-5 形状 定义 和 表达 


如 题 面 : 

如 果 对 一 个 目标 的 形状 采取 如 下 定义 : 从 目标 中 过 滤 掉 位 置 .尺度 和 旋转 变化 的 效果 
后 保留 下 来 的 几何 信息 ,那么 可 如 何 借 此 来 表达 目标 的 形状 呢 ? 

要 解析 

位 置 , 尺 度 和 旋转 的 变化 都 可 用 相似 变换 来 描述 ,所 以 可 以 说 形状 包括 了 所 有 对 相似 变 
换 不 变 的 几何 信息 。 该 形状 定义 是 可 以 推广 的 ,如 用 仿 射 变换 替代 相似 变换 , 留 下 来 的 几何 
信息 就 会 更 少 一 些 , 对 形状 的 定义 也 将 更 严格 。 

对 目标 形状 的 表达 常常 需要 用 到 表达 目标 的 轮廓 ,而 目标 轮廓 是 所 有 轮廓 点 x 二 

[z，yJ 的 函数 。 对 一 个 圆锥 目标 ,其 轮廓 上 点 的 表达 式 可 以 写成 xTSx 二 0, 如 果 展 开 成 齐 
次 坐标 可 写 为 : 
Su Sa Sa 
Sz Sz Sz ||y 
Ss Si SJLl 
其 中 ,变换 矩阵 $S 中 的 Si 二 Sz ,Si 一 Si ,S2 一 Sas。 圆 锥 目标 对 应 的 形状 包括 圆 、 椭 圆 、 抛 
物 线 和 双 曲 线 。 具 体形 状 取决 于 6 个 系数 Su 、Sis 、S13、Szs 、Szs 、Sss。 


11-6 分形 维 数 的 计算 


I 


民 汪 珊 国 


一 0 














名 题 面 : 

图 题 11-6 中 的 3 个 图 案 是 如 下 依次 得 到 的 : 先 在 一 个 圆 中 构建 上 下 两 个 互 切 的 内 切 
圆 , 去 掉 下 面 的 圆 ( 见 图 题 11-6(a)); 在 上 面 剩 下 的 圆 中 再 构建 上 下 两 个 互 切 的 内 切 圆 , 并 
去 掉 新 构建 的 下 面 的 圆 ( 见 图 题 11-6(b)); 在 上 面 剩 下 的 圆 中 再 构建 上 下 两 个 互 切 的 内 切 
圆 ,并 去 掉 新 构建 的 下 面 的 圆 ( 见 图 题 11-6(c)); 以 此 类 推 。 求 这 个 图 形 集合 的 分 形 维 数 。 
30 ® 

















(a) (b) (©) 
图 题 11-6 圆 内 切 圆 图 案 
所 解析 : 
借助 合计 数 方法 的 分 析 思 路 ,可 获得 覆盖 这 个 集合 的 开 圆 个 数 N(~) 随 半径 ~ 变化 的 情 
况 , 如 表 解 11-6 所 示 。 


表 解 11-6 N(r) 随 r 变化 的 情况 











如 N(r) 
1/2=(1/2) (1)=(1/2) (1/2)° 1 一 4 
1/4=(1/2) (1/2)=(1/2) (1/2)! 4 一 4 
1/8=(1/2) (1/4)=(1/2) (1/2) 16 一 4 








由 表 解 11-6 可 见 ,r 以 1/2 的 因子 递减 ,而 NC-) 以 4 的 因子 递增 ,所 以 有 4 一 (1/2)4。 
这 样 可 知 分 形 维 数 d 二 lg(4)/lg(2) 二 2, 与 拓扑 维 数 相同 (注意 这 里 是 一 个 光滑 集合 )。 


11-7 移动 目标 的 成 像 


名 题 面 : 

考虑 最 基本 的 成 像 模 型 , 即 世界 坐标 系 XYZ 与 摄像 机 坐标 系 xyx 重合 ,成 像 平面 zy 
与 xy 重合 。 设 摄像 机 镜头 的 焦距 为 1, 在 时 间 :二 0 时 ,一 个 点 目标 位 于 世界 坐标 点 (10， 
20, 30), 且 以 (一 3, 一 2, 一 1) 的 速度 沿 直 线 移动 。 计 算 该 目标 在 成 像 平面 上 的 运动 轨迹 ， 
并 据 此 推断 :一 一 cc 时 ,该 目标 在 成 像 平 面 上 的 位 置 。 

目标 在 世界 坐标 系 中 坐标 的 参数 表达 形式 为 : (X, Y, 2Z) 二 (10 一 3t, 20 一 2t, 30 一 1)。 
根据 基本 成 像 模 型 中 (X,Y, Z) 投 影 到 (z'，y') 的 关系 可 知 : (z',，y)=[(G10 一 3t)/(G 一 
29), (20—21)/(t—29)]。 

这 里 点 运动 速度 为 负 值 , 表 明 目 标 是 向 着 摄像 机 的 方向 运动 的 。 当 :一 一 cc 时 ,运动 可 
以 追溯 到 无 穷 远 处 的 原始 起 点 ,此 点 的 成 像 坐标 为 (一 3, 一 2) 。 


11-8 ”转动 目标 的 成 像 


名 题 面 : 
考虑 最 基本 的 成 像 模 型 . 即 世界 坐标 系 XYZ 与 摄像 机 坐标 系 xyz 重合 ,成 像 平面 zy 
» LL 





与 xy 重合 。 设 摄像 机 镜头 的 焦距 为 3 ,在 时 间 :一 0 时 ,一 个 点 目标 位 于 世界 坐标 点 (10, 0， 
10) , 且 以 角速度 x/2 逆 时 针 ( 从 乙 轴 正 向 看 过 去 ) 旋 转 。 在 时 间 :一 10 时 ,计算 

(1) 该 目标 的 世界 坐标 。 

(2) 该 目标 的 成 像 坐标 。 

名 解析 : 

(1) 因为 绕 Z 轴 转 动 ,所 以 目标 的 Z 坐标 不 变 , 为 10。 在 1 二 10 时 扫 过 的 弧度 为 : 10X 
r/2 王 5rx, 所 以 有 X 王 10Xcos(5r) 一 一 10,Y 王 10Xsin(5r) 一 0。 

(2) 该 目标 的 摄像 机 坐标 中 > 一 3( 等 于 焦距 ), 所 以 根据 投影 中 相似 三 角形 的 关系 ,有 
x=zX/Z 3,y=zY/Z=0。 


11-9 中 值 维护 背景 的 背景 建 模 方法 














名 题 面 : 

基于 中 值 维护 背景 是 一 种 简单 的 背景 建 模 方法 。 为 什么 在 下 面 两 种 情况 下 它 不 能 准确 
地 将 运动 目标 和 背景 分 离开 ? 

(1) 场景 中 有 多 个 目标 同时 和 运动。 

(2) 场景 中 的 目标 运动 很 缓慢 。 

各 解析 : 

(1) 参见 图 解 11-9(1), 当 多 个 目标 在 场景 中 同时 进行 运动 ,它们 在 图 像 中 有 可 能 互相 
重 倒 ,重生 部 分 的 运动 目标 像素 将 对 背景 的 中 值 产生 较 大 的 影响 ,从 而 影响 运动 目标 和 背景 
的 分 离 。 这 种 重 和 的 概率 一 般 会 随 着 目标 个 数 的 增加 而 越 来 越 大 。 

(2) 参见 图 解 11-9(2), 当 目标 运动 很 缓慢 时 ,在 较 长 一 段 时 间 内 目标 会 自我 重生 ,这 些 
重生 区 域 的 背景 中 值 会 逐渐 接近 目标 自身 的 像素 值 ,此 时 目标 与 背景 就 不 易 分 离 了 。 目 标 
运动 越 慢 ,重生 越 多 , 则 分 离 目 标 就 越 困 难 。 当 目标 的 运动 慢 到 接近 不 动 , 则 目标 就 几乎 成 





























为 了 背景 。 
村 f 面 | 
图 解 11-9(1) ”多 个 运动 目标 的 示意 图 图 解 11-9(2) ”目标 运动 很 慢 的 示意 图 
11-10 高 斯 混合 模型 
名 题 面 : 


列 出 利用 高 斯 混合 模型 计算 和 保持 动态 背景 帧 的 主要 步骤 。 


“ 3 


可 解析: 
(1) 将 一 个 像素 随时 间 而 灰 度 变化 的 情况 f(t) 用 个 高 斯 分 布 N (ju， ot) 来 混合 
建 模 : 
Ni(t) = N[pa(t) et(t] k=1,.…,K 
(2) 对 每 个 高 斯 分 布 加 个 权重 wi (7) ,计算 观察 到 f(7) 的 概率 : 
一 | 


oi (1) 





K 
1 I 
P[Lf()]= wi (1) ex 
宕 V2r ?| 


(3) 读 入 一 幅 新 图 像 , 将 当前 像素 点 与 高 斯 函数 进行 比较 ,匹配 就 执行 (4); 不 匹配 就 
执行 (5)。 所 有 的 像素 点 都 更 新 后 , 读 入 新 图 像 ,重复 (3); 如 果 没 有 新 图 像 了 ,执行 (6)。 
(4) 在 多 个 匹配 中 选 一 个 最 好 的 对 高 斯 分 布 更 新 权重 : 


(I—aw(t—1), £¥1 
wi(t) = 
wi(t—1), k=1l 


(5) 将 权重 最 小 的 高 斯 分 布 用 一 个 具有 均值 f(z) 的 新 高 斯 分 布 代替 ,训练 下 一 幅 图 像 。 
(6) 确定 所 得 到 的 高 斯 分 布 是 前 景 或 背景 。 


11-11 辐射 状 模糊 程度 


所 题 面 : 

图 题 11-11 给 出 一 个 相机 静止 而 景物 运动 时 的 退化 过 程 示意 图 (相机 运动 而 景物 静止 
应 与 此 等 价 ) 。 设 快门 打开 时 景物 平面 位 于 2Z = 已 处 ,快门 关闭 时 景物 平面 运动 到 Z== PP” 
处 ,成 像 平 面 在 O 处 ,W 和 了 丈 ' 之 间 的 点 均 投射 到 工 点 ,导致 出 现 辐射 状 模糊 。 在 成 像 平 面 
上 ,各 点 的 模糊 程度 是 什么 关系 ? 











图 题 11-11 运动 退化 过 程 示意 图 


各 解 析 : 

快门 打开 时 景物 平面 和 镜头 间 的 距离 为 PQ, 景 物 平面 相对 于 相机 的 运动 速度 与 曝光 
时 间 的 乘积 等 于 PP'。 

对 图 像 中 某 一 点 沿 径 向 的 模糊 像素 数 除 以 该 点 距 辐射 中 心 的 像素 数 应 该 等 于 这 一 点 的 
模糊 程度 , 设 为 M, 则 





WV _ WW’_ PP 
WP WeQ PQ 
可 见 , 成 像 平 面 上 某 点 的 模糊 程度 与 该 点 在 图 像 中 的 位 置 无 关 。 


M= 





» L338 & 


11-12 视频 中 目标 的 运动 


所 题 面 : 
场景 中 有 一 个 正方 形 目 标 ,用 帧 率 为 25fps” 的 摄像 机 拍摄 了 一 段 视频 ( 光 轴 与 目标 平 
面 垂 直 )。 在 第 一 帧 中 ,目标 的 两 个 对 角 顶 点 的 坐标 分 别 为 (2, 2) 和 (7, 7)。 在 第 二 帧 中 ， 





动 , 求 第 二 帧 中 另 一 个 顶点 (11, 4) 的 运动 模式 (包括 速度 和 方向 ) 。 

名 解析 : 

目标 的 运动 情况 可 用 图 解 11-12 来 示意 ,目标 在 7 
第 一 帧 中 的 原始 位 置 用 细 实 线 正 方形 表示 ,在 第 二 帧 6 
中 的 终止 位 置 用 粗 实 线 正 方形 表示 。 目 标的 运动 可 
以 分 解 为 两 个 基本 运动 : 由 (2, 2) 到 (4, 3) 的 平 动 ( 实 
线 箭头 ) 和 绕 (4，3) 的 转动 (点 线 箭头 )。 图 中 的 虚线 “ 
正方 形 表示 仅 平 动 的 结果 。 

先 计算 第 二 帧 中 正方 形 另 两 个 顶点 的 坐标 , 设 为 
(zx, y)。 由 第 一 帧 中 目标 的 两 个 对 角 顶 点 的 坐标 可 图 解 11-12 目标 运动 情况 示意 图 
知 , 正 方形 的 边 长 为 5, 所 以 得 到 方程 : (x 一 4)? 十 (y 一 3)* 二 5*。 青 考虑 正方 形 的 两 个 直角 
边 互 相 垂 直 , 可 得 到 方程 : (x 一 4)(x 一 11) 十 (y 一 3)(y 一 4) 二 0。 联 立 解 得 男 两 个 顶点 的 坐 
标 : (7， 7) 和 (8, 0)。 

根据 视频 帧 率 , 可 知 相 邻 两 帧 之 间 的 时 间 间 隔 :为 0.04s。 正 方形 的 整体 平移 速度 为 
(2, 2) 到 (4, 3) 的 移动 距离 除 以 移动 时 间 , 所 以 该 速度 的 幅 值 为 V5 /0. 04 ,方向 与 矢量 (2, 1) 
相同 。 正 方形 平移 后 ,顶点 (7, 7) 到 达 (9, 8)。 顶 点 (11, 4) 绕 顶点 (4,， 3) 转 动 的 角度 是 从 
(4, 3) 到 (9, 8) 的 直线 与 从 (4, 3) 到 (11, 4) 的 直线 之 间 的 夹 角 ,该 夹 角 约 为 36. 8"。 转 动 的 
线 速度 的 幅 值 约 为 113. 76 ,方向 与 矢量 (一 1, 7) 相 同 。 顶 点 (11, 4) 的 运动 速度 和 方向 是 平 
移 运动 矢量 与 转动 运动 撩 量 的 矢量 合成 。 


11-13 光 流 方程 





























名 题 面 : 

设 在 相 邻 两 时 刻 :一 0 和 :二 1 采集 的 两 幅 图 像 如 图 题 11-13 所 示 , 白 色目 标 处 灰 度 为 
1, 背 景 阴 影 处 灰 度 为 0。 请 给 出 求解 光 流 方程 和 利用 最 小 二 乘 光 流 估计 来 计算 目标 运动 撩 
量 的 过 程 。 

名 解析 : 

设 图 像 左 上 角 为 坐标 原点 , 则 点 (1. 1) 处 的 灰 度 和 时 间 变 化 率 可 如 下 计算 : 


ee Eh = 二 [f01,1,D +f(2,1,1) 上 





* ”fps 为 frame per second 的 缩写 。 
。134。 





图 题 11-13 ” 相 邻 时 刻 的 两 幅 图 像 


工 LfG,1,0) 十 7C2,1,0) + Fl,2,0) + f(2,2,0)] = 一 子 


Fl = 计 [f(2,1,D + F6252,0) 十 (2,1,1) +f(2,2,1)] 一 


革 [L7G1,1,0) + 了 52,0) 十 7G1,1,1) + 了 01,2,1)] = 一半 


a yb = 二 [f(1,2,0) 十 fC2,2,0) 十 f(1,2,1) 十 f(2,2,1)] 一 


于 [7G,1,0) 十 72,1,0) 十 7(G1,1,1) 十 7(2,2,1)] = 一 十 











对 4 个 目标 点 都 进行 相同 计算 ( 逐 行进 行 ) ,依次 得 到 f.(2, 1)= 一 1/4,f,(1, 2)== 一 2/4， 
fi(1, 3)=—1/4; f.(2, 1)=0,f,.(1, 2) 王 一 2/4, 广 (1, 3)=—1/4; f,(2, 1)=0,f,(1, 2)= 
0,fy(1,， 3)= 一 1/4。 这 样 ， 


一 2/4 一 1/4 2 1 
0 0 1|0 0 
| 
一 = | 


区 == 区 


11-14 ”基本 运动 和 光 流 场 


各 题 面 : 

试 给 出 几 个 基本 运动 (平移 ,旋转 、 拉 伸 、 剪 切 、 放 射 ) 所 导致 的 光 流 场 的 示意 图 。 

扣 解 析 : 

图 解 11-14 依次 给 出 基本 的 (水 平平 移 、( 绕 中 心 ) 旋 转 、( 水 平 ) 拉 伸 、( 混 合 ) 剪 切 、( 中 
心 ) 放 射 运动 的 光 流 场 示意 图 。 
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图 解 11-14 5 个 基本 运动 的 光 流 场 示意 图 
» 到 





由 图 解 11-14 可 见 : 
(1) 水 平平 移 光 流 场 中 各 点 光 流 矢量 的 大 小 都 是 相同 的 ,方向 均 是 沿 水 平方 向 的 。 

(2) 绕 中 心 旋转 光 流 场 中 各 点 光 流 矢量 的 方向 均 在 以 旋转 中 心 为 圆心 的 圆周 的 切线 方 
向 上 ,大 小 则 随 其 与 旋转 中 心 的 距离 增加 而 增 大 。 

(3) 水 平 拉 伸 光 流 场 中 各 点 光 流 矢量 的 大 小 和 方向 均 不 同 ,包括 水 平方 向 上 由 中 心 向 
外 的 分 量 和 垂直 方向 上 由 外 向 中 心 的 分 量 。 它 们 组 合 的 结果 是 接近 中 心 处 的 光 流 矢量 比较 
小 而 接近 边缘 处 的 光 流 矢量 比较 大 。 如 果 将 光 流 场 用 井 字 划分 为 3X3 的 网 格 , 则 中 心 区 域 
方向 不 明显 ,中心 区 域 的 上 下 两 个 区 域 的 光 流 矢量 指向 中 心 , 而 中 心 区 域 的 左右 两 个 区 域 的 
光 流 矢量 指向 两 边 ,最 后 对 角 4 个 区 域 的 光 流 矢量 在 与 放射 向 外 方向 的 正 交 方向 上 。 

(4) 如 果 将 混合 剪 切 光 流 场 旋转 45°, 则 其 中 的 光 流 矢量 分 布 与 拉 伸 光 流 场 比较 相似 。 

(5) 中 心 放射 光 流 场 中 各 点 光 流 矢量 全 部 都 离开 中 心 而 去 (方向 向 外 ), 而 大 小 则 随 点 
与 放射 中 心 的 距离 增加 而 增 大 。 


11-15 ”运动 场 和 光 流 的 不 一 致 














各 题 面 : 

试 举 出 几 个 光 流 与 运动 场 不 一 致 的 实例 。 

如 解析 : 

(1) 考虑 一 个 沿 着 观测 方向 运动 的 物体 。 在 较 小 的 移动 距离 内 ,物体 表面 的 灰 度 可 认 
为 不 变 , 这 样 观察 者 就 觉察 不 到 物体 的 运动 。 这 种 情况 下 物体 有 运动 场 , 但 是 没有 光 流 。 

(2) 考虑 在 均匀 背景 中 ,摄像 机 和 物体 以 相同 速度 沿 相同 轨迹 运动 ,此 时 虽然 摄像 机 和 
物体 都 有 运动 ,但 是 并 不 能 观察 到 光 流 。 

(3) 考虑 在 拍摄 电影 时 ,通过 快速 移动 演员 背后 的 蓝天 白云 背景 可 以 让 观众 看 到 腾 云 
驾 雾 的 视觉 效果 。 这 种 情况 下 ,演员 本 身 并 没有 运动 ,但 是 以 背景 为 参考 演员 身上 有 光 流 。 

(4) 考虑 教室 中 有 多 组 灯 , 如 果 顺 序 打开 或 关闭 若干 组 ,虽然 景物 没有 运动 ,摄像 机 拍 
摄 的 教室 图 像 中 会 有 光 流 导致 的 变化 。 

(5) 摄像 机 变焦 会 改变 视 场 , 尽 管 景物 不 运动 ,摄像 机 拍摄 的 图 像 中 也 会 有 光 流 导致 的 

(6) 考虑 物体 做 匀速 直线 运动 ,同时 照明 条 件 发 生 非 线性 的 变化 。 此 时 虽然 运动 场 不 
为 零 , 光 流 也 会 发 生 改 变 , 但 是 从 光 流 场 并 不 能 正确 地 获得 运动 场 实际 变化 的 准确 情况 。 

(7) 固定 摄像 机 采用 延 时 摄影 方式 拍摄 建筑 物 ,尽管 景物 不 运动 ,摄像 机 拍摄 的 图 像 中 
也 会 出 现 随 着 光照 条 件 的 变化 而 导致 的 光 流 。 

(8) 白天 从 地 球 上 观察 太阳 (或 晚上 从 地 球 上 观察 月 球 ) ,地 球 有 自转 但 基本 上 观察 不 
到 光 流 。 


11-16 卡尔 曼 滤波 和 粒子 滤波 


名 题 面 : 
列表 比较 卡尔 曼 滤波 和 粒子 滤波 的 适用 场合 、 应 用 要 求 、 计 算 速 度 、 稳 健 性 ( 抗 干 扰 能 力 )。 
“人 丙 





忌 解 析 : 
对 卡尔 曼 滤 波 和 粒子 滤波 的 比较 见 表 解 11-16 。 


表 解 11-16 卡尔 曼 滤波 和 粒子 滤波 的 比较 


比较 项 目 


卡尔 曼 滤 波 


粒子 滤波 





适用 场合 


状态 方程 线性 ,所 以 只 适用 于 线性 系统 


可 用 于 各 种 线性 和 非 线性 系统 





应 用 要 求 


状态 分 布 高 斯 ,系统 模型 已 知 , 算 法 更 新 过 
程 需要 观测 值 


可 用 于 非 高 斯 的 场合 ,但 算法 复杂 度 高 ,对 硬 
件 要 求 较 高 





计算 速度 


运算 速度 较 快 ,实时 性 较 高 


重 采样 复杂 ,运算 速度 较 慢 , 实 时 性 较 差 





稳健 性 





当 数 据 有 较 大 偏差 ( 野 点 ) 时 会 产生 较 大 
误差 


11-17 


如题 面 : 
列表 比较 卡尔 曼 滤 波 、 均 移 滤波 、 粒 子 滤 波 、 马 尔 可 夫 蒙特 卡 洛 方法 在 目标 跟踪 中 的 优 


缺点 。 


亏 解 析 : 
对 这 些 滤 波 方法 优 缺点 的 对 比 见 表 解 11-17。 


表 解 11-17 不同 滤波 方法 的 优 缺 点 


可 以 通过 改变 重 采 样 参数 来 提高 稳健 性 





不 同 跟 踪 方 法 的 优 缺 点 

















比较 方法 优点 缺点 
卡尔 受 涉 波 “| 计算 量 小 ,速度 恢 局 限于 线性 高 斯 系统 
跟踪 速度 快 ,通常 ?或 3 次 迭代 即 | 本 质 是 局 部 匹配 ,容易 陷 人 局 部 极 值 ; 对 初始 
均 移 滤波 可 收 化 ， 实现 简单 ,测量 信 直 接 反 | 让 儿科 入耳 入 护 愉 从 他 这 
映 到 跟踪 结果 中 2 i 
基于 概率 统计 ,不 易 陷 人 局 部 极 
粒子 滤波 值 ; 对 被 跟踪 目标 的 尺度 变化 比较 | 随 着 粒子 数目 增加 计算 量 会 急剧 增加 
鲁 棒 ; 可 以 跟踪 目标 的 突然 运动 
马尔 可 夫 莹 特 | 相对 于 粒子 滤波 其 抽样 方法 更 合 
会 急 
es a, 随 着 抽样 数目 增加 计算 量 会 急剧 增加 
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本 单元 包括 4 章 : 

第 12 章 三 维 表达 
第 13 章 立体 视觉 
第 14 章 景物 重 构 
第 15 章 知识 和 匹配 


覆盖 范围 /内 容 简介 

图 像 理解 对 应 图 像 工程 的 第 三 层次 ,主要 涉及 高 层 的 操作 ,基本 上 根据 较 抽 象 的 描述 进 
行 解析 、 判 断 、 决 策 ( 符 号 运算 ), 其 处 理 过 程 和 方法 与 人 类 的 思维 推理 有 许多 类 似 之 处 。 对 
图 像 的 高 层 理解 是 要 通过 对 图 像 中 各 个 目标 的 自身 性 质 和 它们 之 间 相 互 关 系 的 研究 ,了 解 
把 握 图 像 内 容 并 解释 原来 的 客观 场景 。 理 解 的 结果 能 为 用 户 提供 客观 世界 的 信息 ,从 而 指 
导 和 规划 行动 。 它 要 完成 的 工作 包括 (在 处 理 和 分 析 基 础 上 ) 对 3-D 客观 场景 信息 的 获取 和 
表达 、 景 物 的 重建 ,场景 的 解释 等 ,以 及 上 述 过 程 中 的 相关 知识 及 应 用 ,为 完成 这 些 工 作 所 采 
用 的 控制 和 策略 等 。 

图 像 分 析 可 看 作 代 表 一 大 类 图 像 技术 ,关心 的 是 如 何 根据 图 像 给 出 对 场景 的 描述 和 判 
断 , 它 要 借助 计算 机 构建 系统 来 帮助 解释 图 像 的 含义 ,从 而 实现 利用 图 像 信 息 解释 客观 世 
界 。 它 要 确定 为 完成 某 个 任务 需要 通过 图 像 采集 从 客观 世界 获取 哪些 信息 ,需要 通过 图 像 
处 理 和 分 析 从 图 像 中 提取 哪些 信息 ,以 及 利用 哪些 信息 继续 加 工 以 获得 需要 的 决策 。 它 要 
研究 理解 能 力 的 数学 模型 ,并 通过 对 数学 模型 的 程序 化 ,实现 理解 能 力 的 计算 机 模拟 。 

图 像 理解 和 计算 机 视觉 密切 相关 。 图 像 是 表达 视觉 信息 的 一 种 物理 形式 ,图 像 理解 必 
须 借助 计算 机 ,基于 对 图 像 的 处 理 和 分 析 来 进行 。 计 算 机 视觉 作为 一 门 学 科 , 与 许多 以 图 像 














作为 主要 研究 对 象 的 学 科 ,特别 是 图 像 处 理 、 图 像 分 析 、 图 像 理解 有 着 非常 密切 的 联系 和 不 
同 程度 的 交叉 。 计 算 机 视觉 主要 强调 用 计算 机 实现 人 的 视觉 功能 ,这 中 间 实 际 上 需要 用 到 
图 像 工程 3 个 层次 的 许多 技术 ,虽然 目前 的 研究 内 容 主要 与 图 像 理 解 相 结合 。 
图 像 理 解 和 计算 机 视觉 这 两 个 名 词 也 常常 交替 使 用 。 从 本 质 上 讲 , 它 们 互相 联系 ,在 很 
多 情况 下 其 内 容 交叉 重合 ,在 概念 上 或 实用 中 并 没有 绝对 的 界限 。 在 许多 场合 和 情况 下 , 它 
们 昌 各 有 侧重 但 常常 是 互 为 补充 的 ,所 以 将 它们 看 作 是 专业 和 /或 背景 不 同 的 人 习惯 使 用 的 
不 同 术语 更 为 恰当 。 
学 习 图 像 理解 ,主要 内 容 通 常 包 括 : 采集 能 反映 场景 内 容 和 本 质 ( 如 深度 信息 ) 的 图 像 ; 
从 图 像 恢复 场景 (借助 2-D 图 像 重建 3-D 场景 ), 这 可 以 使 用 ( 双 目 或 多 目 ) 立 体 视觉 技术 或 
( 单 幅 图 像 或 多 幅 ) 景 物 恢复 技术 ; 表达 3-D 空间 的 景物 ,描述 其 特性 ; 对 场景 进行 分 析 以 
给 出 语义 解释 ,这 需要 借助 知识 进行 推理 ,将 从 图 像 中 获得 的 信息 与 已 有 的 解释 场景 的 模型 
进行 匹配 ,借助 相应 的 数学 工具 建立 对 场景 的 高 层次 解释 。 
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图 像 理 解 需要 把 握 客 观 场景 的 完整 信息 。 客 观 景 物 是 3-D 的 ,需要 对 它们 采取 合适 的 
数据 结构 进行 表达 ,并 采用 恰当 的 形式 描述 它们 的 特性 ,以 有 效 地 进行 刻画 。 事 实 上 ,从 
2-D 世界 向 3-D 世界 发 展 的 过 程 所 带 来 的 变化 不 仅 是 量 的 丰富 而 且 有 质 的 飞跃 (如 在 2-D 
空间 中 ,区 域 是 由 线 封 闭 而 成 的 ; 而 在 3-D 空间 中 ,仅仅 由 线 并 不 能 包围 体积 。 又 如 在 2-D 
空间 中 ,平行 的 直线 经 过 变换 仍 保持 平行 性 ; 而 在 3-D 空间 中 ,平行 的 直线 经 过 变换 有 可 能 
变 成 汇聚 直线 ) , 它 对 视觉 信息 的 表达 和 加 工 在 理论 上 和 方法 上 都 提出 了 新 的 要 求 。 

客观 景物 具有 不 同 的 3-D 结构 ,需要 有 相应 的 3-D 表达 方法 。 各 种 不 同 层 次 的 3-D 结 
构 常 常 需要 用 不 同 的 方法 来 表达 ,因为 它们 有 可 能 对 应 不 同 的 抽象 层次 。 首 先 ,3-D 图 像 的 
基本 单元 是 体 素 ,所 以 可 以 用 体 素 表达 3-D 景物 。 其 次 ,观察 3-D 景物 看 到 的 是 其 外 表面 ， 
此 时 关心 的 主要 是 表面 的 反射 性 质 , 如 灰 度 ,颜色 ` 纹 理 等 ,所 以 需要 使 用 曲面 来 表达 3-D 景 
物 ( 可 以 直接 看 得 到 的 部 分 )。 通 过 对 3-D 物体 各 个 表面 朝向 的 表达 可 勾勒 出 物体 的 外 观 形 
状 , 而 要 表达 表面 的 朝向 可 借助 表面 的 法 线 。 另 外 ,对 于 3-D 目标 表面 ,一 类 常用 的 边界 表 
达 方 法 是 利用 多 边 形 网 格 (mesh)。 这 里 多 边 形 由 顶点 ,边缘 和 表面 组 成 ,每 个 网 格 可 看 成 
一 个 面 元 。 给 定 一 组 立体 数据 ,获得 上 述 多 边 形 网 格 并 用 面 元 集合 来 表达 目标 表面 的 过 程 
常 称 为 表面 拼接 。 最 后 ,真实 世界 中 的 景物 都 是 3-D 的 实体 ,对 它们 的 全 面 表达 (包括 表面 
和 内 部 , 即 可 以 直接 看 得 到 的 部 分 和 不 能 直接 看 得 到 的 部 分 ) 还 需要 借助 各 种 体积 模型 。 

本 章 的 问题 涉及 上 述 3-D 表达 多 个 方面 的 概念 。 


12-1 接续 曲线 的 高 斯 图 








如 题 面 : 

设 在 第 一 象限 中 的 一 个 点 Q 沿 一 条 曲线 C 向 原点 移动 。 如 果 Q 到 达 原 点 后 继续 运动 ， 
那么 它 的 下 一 个 位 置 可 能 会 有 分 别 在 第 一 、 二 ,三 、 四 象限 的 4 种 情况 ,如 图 题 12-1(a)、 
图 题 12-1(b) 、 图 题 12-1(c) 、 图 题 12-1(d) 所 示 。 

N 0 N 2 N 2 V 2 
已 二 Cc [oy 

P| 了 P| | i P| ~ 

(a (b) (0 (d) 


图 题 12-1 4 种 曲线 变化 情况 


(1) 如 果 将 图 题 12-1(c) 的 曲线 接 画 在 图 题 12-1(d) 的 曲线 之 后 ,再 将 图 题 12-1(b) 的 
曲线 接 画 在 图 题 12-1(c) 的 曲线 之 后 ,给 出 这 样 接续 曲线 的 高 斯 图 。 

(2) 如 果 将 图 题 12-1(c) 的 曲线 接 画 在 图 题 12-1(d) 的 曲线 之 后 ,再 将 图 题 12-1(a) 的 
曲线 接 画 在 图 题 12-1(c) 的 曲线 之 后 ,给 出 这 样 接续 曲线 的 高 斯 图 。 

(3) 比较 上 述 两 个 高 斯 图 的 异同 。 

握 解 析 : 

(1) 这 种 情况 下 的 接续 曲线 及 其 高 斯 图 如 图 解 12-1(1) 所 示 。 





图 解 12-1(1) 第 一 种 情况 的 接续 曲线 及 其 高 斯 图 
(2) 这 种 情况 下 的 接续 曲线 及 其 高 斯 图 如 图 解 12-1(2) 所 示 。 








Py / OQ 
mp [03 
图 解 12-1(2) 第 二 种 情况 的 接续 曲线 及 其 高 斯 图 


(3) 从 接续 曲线 看 ,第 一 种 情况 比 第 二 种 情况 少 了 一 个 规则 点 而 多 了 一 个 第 二 类 尖 点 。 
从 高 斯 图 看 ,第 二 种 情况 比 第 一 种 情况 多 了 一 次 反 转 变化 。 在 第 一 个 高 斯 图 中 ,从 Qs 顺 时 
针 到 了 Qs 后 继续 顺 时 针 到 了 Q; ; 而 在 第 二 个 高 斯 图 中 ,从 Qs 顺 时 针 到 了 Q 后 反 转 逆 时 
针 到 了 Q， 。 


12-2 ”曲面 上 的 主 方向 


各 题 面 : 

给 定 一 个 曲面 S, 试 证 明 其 在 点 已 处 有 两 个 主 方向 ,除非 在 点 已 处 是 了 

切 解 析 1: 

如 果 曲 面 S 上 一 点 P 处 是 平面 , 则 其 平均 曲率 太 和 高 斯 曲率 G 都 为 零 ,所 以 两 个 主 法 
。 143。 


六 


面 。 





曲率 都 为 零 : 





Ki=H+VH-G=0=H—VH-G= K;, 
如 果 曲 面 S 上 一 点 已 处 不 是 平面 , 则 其 平均 曲率 瓦 和 高 斯 曲率 G 至 少 有 一 个 不 为 零 ， 
所 以 两 个 主 法 曲率 不 会 同时 为 零 , 它 们 对 应 两 个 主 方向 。 
如 解析 2: 
从 微分 几何 的 角度 看 , 主 方向 既 正 交 又 共 轿 ,其 二 次 方程 的 判别 式 为 
A= (EN — JL)’—4(EM — FL)(FN — GM) 
4(EJ] —F’) 
FE’ 




















= [‘EN -IL) (EM FL)] + (EM — FL)? 
判别 式 为 零 时 ,每 个 方向 都 是 主 方向 ,这 正 对 应 平面 时 的 情况 。 判 别 式 大 于 零 时 ,二 次 
方程 有 两 个 不 相等 的 实 根 ,这 对 应 非 平面 时 的 情况 。 





12-3 ” 鞍 疹 和 鞍 谷 表面 的 方向 导数 


气 题 面 : 
分 别 讨 论 在 鞍 背 和 鞍 谷 处 两 个 二 次 方向 导数 的 正 负 符 号 情况 。 
如 解析 : 


在 鞍 脊 处 ,应 该 有 K, 一 0,Ks 二 0, 且 | KR | 二 |Ks | 。 即 两 个 二 次 方向 导数 具有 相 异 的 符 
号 , 且 正 值 方向 导数 的 绝对 值 小 于 负 值 方向 导数 的 绝对 值 。 也 可 以 说 ,两 个 二 次 方向 导数 之 
积 小 于 零 ,而 它们 之 和 也 小 于 零 。 
在 鞍 谷 处 ,应 该 有 Ki 二 0,K; 二 0, 且 |Ki||1K;|。 即 两 个 二 次 方向 导数 具有 相 异 的 符 
号 , 且 正 值 方向 导数 的 绝对 值 大 于 负 值 方向 导数 的 绝对 值 。 也 可 以 说 ,两 个 二 次 方向 导数 之 
积 小 于 零 ,但 它们 之 和 大 于 零 。 


12-4 能 券 表面 的 曲率 








各 题 面 : 

分 析 鞍 疹 表 面 形 状 随 其 各 点 积分 曲率 和 高 斯 曲率 变化 的 关系 。 

所 解析 

鞍 消 表面 上 各 点 的 积分 曲率 五 和 高 斯 曲率 G 都 是 负 值 。 因 为 G 王 KK: 一 0, 所 以 开 ， 
和 K, 应 该 为 一 正 一 负 。 如 果 设 Ri 二 0,K 一 0, 则 由 互 <0, 可 知 |K | 二 |K;|。 这 表明 鞍 疹 
局 部 沿 睡 方向 比 沿 下 竹 方 向 要 更 加 平坦 ( 见 图 解 12-4(a))。 当 互 逐 渐变 大 时 ,K 和 天。 
会 同时 变 大 ,上 竹 面 和 下 竹 面 整体 都 向 上 凸 ( 见 图 解 12-4(b))。 当 互 逐 渐变 小 时 ,K, 入。 
会 同时 变 小 ,上 翘 面 和 下 考 面 整体 都 向 下 止 ( 见 图 解 12-4(c) ) 。 


"A 





图 题 12-4 ” 远 峭 表面 形状 及 变化 


12-5 椭圆 球 的 高 斯 球 和 扩展 高 斯 图 


气 题 面 : 
将 一 个 长 半 轴 为 A、 短 半 轴 为 B 的 椭圆 绕 其 长 轴 旋 转 可 得 到 一 个 椭圆 球 , 试 画 出 该 椭 
圆 球 的 高 斯 球 和 扩展 高 斯 图 的 示意 图 。 


如 解析 : 

先 画 出 该 椭圆 球 如 图 解 12-5(a) 所 示 , 椭 圆 球 表面 上 的 点 可 用 球 坐 标 系 的 两 个 变量 9 
和 $ 表示 。 

高 斯 球 是 一 个 单位 球 。 给 定 3-D 目标 表面 的 一 zh 


点 ,将 该 点 对 应 到 单位 球面 上 具有 相同 表面 法 线 的 点 
就 可 得 到 高 斯 球 。 由 于 椭圆 球 是 光滑 的 封闭 曲面 ,所 
以 其 对 应 的 高 斯 球 是 整个 单位 球面 。 如 图 
解 12-5(b) 所 示 。 

椭圆 球 的 参数 方程 为 : S=(Bsingsing，Bsinbcosg， 
Acos9)。 计 算 它 的 各 个 偏 导 : S 一 (Bcosgsing， (a) (b) 
Beosbcosg, — Asin0), S 一 (一 Bsingcosg, Bsinbsing, 
0),Ss = (— Bsingsing, — Bsinfcos$, — Acos0), Sa 一 
(— Becosbcosg, — Bcosbsing, 0),Sy = (Bsingsing, — Bsinbcosg, 0)。 

接 下 来 计算 ; E=SsSo=B?cos?0 十 A?sin*0,F=SsS;=0,J=S;S,==B’?sin?0,L=QSg 
—AB/(A?sin’0+ B?cos:0)'? ,M=QSy =0,N=QS;, =—ABsin’0/(A?sin’0++ B?cos’0)'®, 
其 中 Q==(Asingcos$，Asingsing，Beos9)/(A?sin?9 十 B?cos*9)?*。 将 它们 代入 求 主 曲率 的 
方程 ,得 到 

B’? (A? sin?ut B? cosiu)’k: 十 
AB sin?u VA sinut B? cosiu(B’ A? sinzu 十 B? cosiwkt A’B? sinzv 一 0 
解 该 一 元 二 次 方程 ,得 到 : 
K 











图 解 12-5 ”椭圆 球 和 高 斯 球 示 意图 











A?B? sinzg A 
B? sin20 (A? sin20 十 B? cos20)2 (A? sin20 十 B? cos20)2 
长 半 轴 为 A、 短 半 轴 为 B 的 旋转 椭 球 面 的 扩展 高 斯 图 G 也 是 一 个 椭圆 ,只 有 9 一 个 自 
由 度 (从 椭 球 的 对 称 性 角度 也 可 以 直观 地 加 以 证 明 ): 
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1 (A2 sin20 十 B? cos20)2 
K A’ 


12-6 曲率 与 挠 率 的 几何 意义 








G 





各 题 面 : 

讨论 和 比较 曲率 与 挠 率 的 几何 意义 。 

气 解析 : 

曲线 是 弯曲 的 ,为 描述 弯曲 程度 ,引入 了 曲率 。 曲 线 在 一 点 处 的 曲率 等 于 该 点 与 其 邻近 
点 的 切线 矢量 之 间 的 夹 角 关于 弧 长 的 变化 率 , 也 就 是 曲线 在 该 点 附近 切线 方向 改变 的 程度 。 
曲线 在 某 点 处 的 曲率 越 大 ,表示 曲线 在 该 点 附近 切线 方向 改变 得 越 快 ,因此 曲线 在 该 点 的 弯 
曲 程度 越 大 。 曲 线 为 直线 的 充分 必要 条 件 是 曲率 恒 为 0。 

空间 曲线 不 仅 会 弯曲 ,还 有 可 能 扭曲 , 即 曲 线 离开 它 的 密切 平面 。 为 描述 扭曲 程度 , 引 
入 了 挠 率 。 曲 线 在 一 点 处 的 挠 率 的 绝对 值 表 示 曲 线 在 该 点 的 副 法 矢量 (密切 平面 的 法 矢量 ) 
关于 弧 长 的 变化 率 , 即 曲线 的 密切 平面 的 变化 程度 。 曲 线 为 平面 曲线 的 充分 必要 条 件 是 挠 
率 恒 为 0。 





12-7 曲率 和 挠 率 的 计算 


如题 面 : 
计算 以 下 各 种 条 件 时 的 曲率 和 搁 率 : 


5，0) 处 。 
(2) 圆柱 螺 线 x 二 acos0, y= 二 asin9, > 一 00(a 二 0.0 二 0) 上 各 点 。 
(3) 曲线 x 二 cos?0, y= 二 sin30, xz 二 cos20(0 二 1 二 x/2) 上 各 点 。 
如 解析 : 


(1) 在 点 Ala, 0, 0) 的 曲率 为 Ks 二 a/B, 在 点 B(0, 5, 0) 的 曲率 为 Ks 二 5b/a?。 因 为 
Ka 记 Ks ,所 以 可 知 该 椭圆 在 长 轴 顶 点 处 的 弯曲 程度 比 在 短 轴 顶 点 处 的 弯曲 程度 高 ,也 可 以 
说 ,该 椭圆 在 短 轴 顶点 处 比 在 长 轴 顶 点 处 更 平坦 。 这 里 椭圆 是 平面 曲线 ,所 以 挠 率 处 处 
为 零 。 

(2) 曲率 为 常数 : K 二 a/(a? 十 丰 ); 挠 率 也 为 常数 : T=b/(a? 十 b?)。 

(3) 曲率 是 9 的 函数 : K 二 6/(25sin20); 挠 率 也 是 0 的 函数 : T=8/(25sin20)。 


12-8 行进 立方 体 算 法 重 构 等 值 面 


各 题 面 : 

试 实现 行进 立方 体 (MC) 算 法 ,展示 它 的 效果 。 

气 解析 : 

用 行进 立方 体 算法 生成 的 两 个 立体 物体 的 展示 效果 如 图 解 12-8 所 示 。 
.146 。 





图 解 12-8 ”用 行进 立方 体 算法 得 到 的 效果 图 图 解 12-8 


12-9 ”覆盖 算法 效果 示例 


各 题 面 : 
试 实现 覆盖 算法 ,展示 它 的 效果 。 
气 解析 : 


用 覆盖 算法 生成 的 一 个 立体 物体 的 三 角形 网 格 效果 如 图 解 12-9 所 示 。 





图 解 12-9 ”用 覆盖 算法 生成 的 三 角形 网 格 


12-10 覆盖 算法 重 构 等 值 面 


各 题 面 : 

图 题 12-10 所 示 为 27 幅 人 体 头 部 MRI 的 2-DD 图 像 , 其 大 小 为 128X128 像素 。 试 实现 
覆盖 算法 ,构造 这 27 幅 图 像 的 外 表 等 值 

各 解析 : 

利用 覆盖 算法 所 构造 的 外 表面 如 图 解 12-10 所 示 , 其 中 使 用 了 32 164 个 三 角 面 元 ,项 
点 个 数 为 15 366。 








卫 








。 147 。 


@@®@e 
(< 有 时 SS 


动力 二 四 @ 四 





| 
101 
5 
| 
20 pr A 
pa 了 40 
60 80 一 一 - 


图 题 12-10 ”27 幅 实 验 图 像 图 解 12-10 用 覆盖 算法 构造 出 的 外 表面 
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立体 视觉 主要 研究 如 何 借助 (多 图 像 ) 成 像 技 术 从 (多 幅 ) 图 像 中 获取 场景 中 物体 的 距离 
(深度 ) 信 息 。 立 体 视 觉 从 两 个 或 多 个 视点 去 观察 同一 个 场景 ,采集 不 同 视角 下 的 一 组 图 像 ， 
然后 通过 三 角 测 量 原理 获得 不 同 图 像 中 对 应 像素 间 的 视差 ( 即 同一 个 3-D 点 投影 到 两 幅 
2-D 图 像 上 时 ,其 两 个 对 应 点 在 图 像 上 位 置 的 差 ), 从 中 获得 深度 信息 ,进而 计算 场景 中 目标 
的 形状 和 它们 之 间 的 空间 位 置 等 。 从 信息 的 角度 看 ,立体 视觉 方法 根据 摄像 机 在 不 同位 置 
获得 的 多 幅 图 像 来 恢复 景物 的 深度 ,可 看 作 将 多 幅 图 像 之 间 的 宛 余 信息 转化 为 深度 信息 。 

立体 视觉 的 工作 过 程 与 人 类 视觉 系统 的 感知 过 程 有 许多 类 似 之 处 ,事实 上 ,人 类 视觉 系 
统 就 是 一 个 天 然 的 立体 视觉 系统 。 一 个 立体 视觉 系统 应 包括 6 个 工作 模块 : 摄像 机 标定 、 
图 像 采集 获取 、 特 征 提取 、 立 体 匹 配 .3-D 信息 恢复 重建 和 后 处 理 。 

除了 直接 参考 人 类 视觉 系统 的 功能 结构 而 构建 的 双 目 立体 视觉 系统 外 ,还 可 以 使 用 多 
于 两 个 摄像 机 (或 将 一 个 摄像 机 先后 放置 在 多 于 两 个 位 置 ) 的 系统 来 获取 同一 场景 的 多 幅 不 
同 图 像 并 进一步 获取 深度 信息 。 这 种 技术 称 为 多 目 立 体 视觉 技术 。 使 用 多 目的 方法 比 使 用 
双 目 的 方法 复杂 但 有 一 定 的 优点 ,包括 可 减少 双 目 立体 视觉 技术 中 图 像 匹 配 的 不 确定 性 , 消 
除 景物 表面 光滑 区 域 引 起 的 误 匹 配 和 减少 景物 表面 周期 性 模式 造成 的 误 匹 配 。 

在 多 目 立体 视觉 系统 中 ,多 目的 位 置 理论 上 可 以 是 任意 的 形式 ,实用 中 主要 有 水 平 多 
目 、 正 交 三 目 、 正 交 四 目 、 单 方向 多 目 与 正 交 三 目 结合 等 。 

本 章 的 问题 涉及 上 述 立体 视觉 多 个 方面 的 概念 。 


13-1 采集 器 移动 与 视差 变化 


如 题 面 : 

在 采用 (平行 ) 双 目 模 向 模式 的 成 像 系统 模型 中 ,分 析 和 比较 采集 器 在 XY 平面 中 移动 
和 沿 Z 轴 移 动 两 种 情况 下 的 成 像 偏 差 变化 情况 。 进 一 步 讨 论 在 哪些 情况 下 ,采集 器 在 XY 
平面 中 移动 更 有 利于 获得 精确 的 深度 距离 测量 。 

芯 解 析 : 

当 采 集 器 沿 Z 轴 移 动 时 ,根据 相似 三 角形 关系 , 像 坐 标 z( 仅 考虑 z,y 也 类 似 ) 与 物 距 
QZ 焦距) 及 物体 X 坐标 满足 关系 : z/A 一 X/Z。 像 坐标 zx 随 物 距 Z 变化 而 产生 视差 ,其 变 
化 率 ( 取 绝 对 值 ) 为 x’ 一 +X/Z?*。 当 采集 器 在 XY 平面 中 移动 时 ,视差 D 与 物 距 QZ 焦距》 及 
基线 长 度 B 满足 关系 : D=AB/Z。 视 差 随 基线 长 度 变 化 ,其 变化 率 ( 取 绝对 值 ) 为 D' 一 AM/Z。 

两 者 相 比 较 , 当 XX 二 Z 时 ,两 个 变化 率 相同 。 实 际 中 一 般 是 Z 之 X, 所 以 采集 器 沿 Z 轴 
移动 比 采集 器 在 XY 平面 中 移动 的 变化 率 要 小 。 换 句 话 说 ,采集 器 在 XY 平面 中 移动 相同 





距离 时 比 采集 器 沿 Z 轴 移 动 相同 距离 时 所 产生 的 成 像 偏差 ( 即 视差 ) 变 化 更 大 ,由 此 获得 的 
深度 距离 测量 也 会 比较 精确 。 














13-2 近视 校正 


名 题 面 : 

设 一 个 人 的 双眼 中 有 一 眼 是 近视 的 , 即 和 ;二 ia 。 为 校正 而 得 到 清晰 的 影像 ,可 以 调节 眼 
球 长 度 或 者 戴 眼 镜 。 借 助 双 目 成 像 模型 ,分 析 使 用 这 两 种 方法 所 得 到 的 深度 感觉 ,它们 是 一 
样 的 吗 ? 

名 解析 : 

可 以 从 两 个 角度 来 说 明 : 

(1) 通过 调节 眼球 长 度 来 校正 相当 于 不 改变 眼 的 焦距 但 将 像 成 在 距离 不 同 的 (视网膜 ) 
平面 上 。 参 照 双 目 成 像 的 模型 , 联 立 双 目的 公式 可 解 得 
MA (Bir zx) 

AsX1 — Mxe 

近视 眼 的 焦距 比较 小 ,将 Z 对 4, 求 导 , 得 到 
—d Bi — 一 Asxzs (B+ zi CO— zo) 

(Mi — A ra)’ Azxi — Mxs (Ms 一 人 Arz )3 
上 式 可 知 ,Zi 随 )。 的 增加 而 减少 ,也 就 是 说 ,深度 将 随 )z 的 增加 而 减少 ,所 以 调节 眼 
球 长 度 比 戴 眼镜 得 到 的 深度 更 大 。 对 双 目 系统 , 仅 在 =) 时 ,才能 得 到 相同 的 深度 。 所 
以 当 丸 二 Xs 时 ,虽然 通过 调节 眼球 长 度 也 可 得 到 清晰 的 影像 ,但 是 此 时 对 深度 的 感觉 与 戴 
眼镜 进行 校正 后 得 到 的 深度 感觉 并 不 一 样 。 

(2) 戴 眼 镜 校正 可 认为 是 要 使 得 两 眼 的 焦距 相等 ,所 以 根据 对 双 目 系统 的 深度 计算 公 
式 , 此 时 的 视差 为 
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调节 了 眼球 长 度 并 不 改变 眼 的 焦距 ,所 以 根据 视差 定义 ,有 
(X+B/2)X%, _ (X—B/DAN _ X 十 B/2 X—B/2 B 
Os Xs—Z 为 一 如 1—Z/ 1 I— aR 











其 中 大 于 号 的 成 立 可 如 下 分 析 : 增 大 ja 使 之 与 hi 相等 相当 于 减 小 Z/4; ,相当 于 增加 第 二 
项 的 分 母 ,从 而 减 小 了 第 二 项 。 所 以 调节 眼球 长 度 与 戴 眼镜 校正 所 得 到 的 深度 感觉 不 一 样 。 


13-3 双 目 成 像 模式 的 比较 


各 题 面 : 
试 比较 双 目 横向 模式 、 双 目 会 聚 横向 模式 和 双 目 纵向 模式 在 视差 计算 精度 、 受 场景 遮挡 
影响 和 受 对 应 点 不 确定 性 影响 方面 的 不 同 特点 。 
气 解析 : 
它们 的 不 同 特点 归纳 在 表 解 13-3 中 。 
。 150。 


表 解 13-3 ” 几 种 双 目 成 像 模式 的 特点 











比较 项 目 双 目 横向 模式 双 目 横向 汇聚 模式 双 目 纵向 模式 
视差 计算 精度 “| 长 ,精度 越 高 ; 物 距 越 大 ，| 较 高 : 与 双 目 横向 模式 类 似 
精度 越 低 点 的 深度 ; 物 距 越 大 , 精 
度 越 低 
受 场 景 遮 挡 | 较 大 :因为 从 不 同 角度 较 小 : 因为 从 同一 角度 
影响 采集 较 大 : 因为 从 不 同 角度 采集 采集 
受 对 应 点 不 确 | 较 大 : 相同 点 亮度 可 能 不 | 较 大 : 相同 点 亮度 可 能 不 同 ，| 较 小 : 相同 点 亮度 几乎 
定性 影响 同 ,重大 区 域 较 少 重 笃 区 域 比 双 目 横向 模式 大 | 相同 , 重 乔 区域 也 较 多 
13-4 ”顺序 性 约束 
各 题 面 : 
举例 说 明 一 般 可 视点 的 顺序 在 由 双 目 立体 视觉 系统 得 到 的 两 幅 图 像 中 是 相同 的 , 即 它 
们 满足 顺序 性 约束 。 
名 解析 : 


考虑 场景 中 有 A、B.C.D 共 4 个 点 ,用 双 目 
立体 视觉 系统 对 它们 成 像 ,如 图 解 13-4 所 示 。 
根据 每 个 摄像 机 的 成 像 几 何 模 型 ,在 第 一 幅 图 
像 中 成 像 点 a 、 a 、di 的 排列 顺序 与 在 第 二 
幅 图 像 中 a ,bs cs cs 的 排列 顺序 是 一 样 的 ,而 
且 与 在 场景 中 A、B、C、D 的 排列 顺序 也 是 一 样 








的 (相对 于 光 心 0, 和 O, 是 倒 像 ) 。 
如 果 场 景 中 还 有 一 个 摄像 机 的 点 巨 , 则 它 的 
成 像 点 e 和 es 可 能 会 插 在 序列 wi .bi .cl di 和 “图 解 134 双 目 立体 视觉 系统 的 顺序 约束 
序列 w .bs .cs .ds 中 的 任意 位 置 ,但 它们 的 排序 在 两 幅 图 像 中 仍然 是 相同 的 。 例 如 , 设 在 第 
一 幅 图 像 中 oi 插 在 了 a, 和 6b 之 间 , 那 么 在 第 二 幅 图 像 中 cs 会 插 在 as 和 6b, 之 间 。 换 句 话 
说 ,一 般 不 会 得 到 如 下 的 结果 ; a ese sd 和 az、bscses( 如 在 图 解 13-4 中 的 成 像 点 
六 ds , 即 e 和 es 在 两 个 序列 中 的 位 序 应 该 是 一 样 的 。 


名 题 面 : 


13-S 
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极 线 与 极点 








由 Hebela 


对 一 个 给 定 的 基于 立体 视觉 技术 的 双 目 成 像 系 统 , 设 每 次 改变 景物 点 的 位 置 后 ,都 能 从 
所 得 到 的 两 幅 图 像 中 确定 出 对 应 点 。 讨 论 在 左 图 像 中 的 所 有 极 线 与 在 右 图 像 中 对 应 的 极点 
之 间 有 什么 关系 。 


气 解析 : 


可 以 从 不 同 角度 出 发 来 分 析 解 决 这 个 问题 。 


» 


(1) 在 双 目 成 像 系 统 中 , 物 点 在 两 幅 图 像 中 的 坐标 之 间 的 联系 可 用 本 质 矩 阵 忆 来 描述 。 

如 果 一 个 物 点 在 左 图 像 中 的 坐标 为 pi ,在 右 图 像 中 的 坐标 为 p; ,那么 这 两 个 坐标 之 间 
的 联系 为 : p, ”Epi 一 0。 这 里 ps 对 应 的 极 线 是 Li 一 E ps。 对 右 图 像 中 的 极点 es ,可 以 看 作 
光 轴 上 一 个 点 在 右 图 像 中 的 成 像 ,从 而 得 到 对 应 的 极 线 是 Li 二 EVe,。 
(2) 当场 景点 在 空间 移动 时 , 左 图 像 上 所 有 的 极 线 都 相交 于 极点 el 。 极 点 就 是 所 有 极 
线 在 各 自 图 像 平 面 上 的 交点 。 左 右 图 像 的 极点 ei 与 ez 分 别 是 摄像 机 光 心 C 和 Cs 在 两 个 
图 像 平面 上 的 投影 ,并且 el ,ez 、C1、C 共 线 于 光 心 线 。 因 此 ,对 于 一 个 位 于 光 心 线 上 的 场景 
点 ,该 点 在 左右 图 像 的 投影 点 即 为 左右 极点 ei 与 es 。 利 用 极 线 约束 可 知 : esTEe 二 0, 所 以 
工 | 一 BTe: 。 








13-6 极 线 与 投影 点 


各 题 面 : 

说 明 在 基于 立体 视觉 技术 的 双 目 成 像 系统 中 ,处 在 图 像 1 平面 上 的 所 有 极 线 都 会 通过 
其 投影 中 心 在 图 像 2 平面 上 的 投影 图 像 点 。 

如 解析 : 

先 考虑 在 投影 中 心 为 C 的 图 像 1 中 的 一 个 图 像 点 已 。 与 其 对 应 的 以 Cs 为 投影 中 心 的 
图 像 2 中 的 极 线 工 应 该 出 现在 平面 PC1C; 与 图 像 2 平面 的 相交 处 。 再 考虑 在 投影 中 心 为 
Ci 的 图 像 1 中 的 另 一 个 图 像 点 Q。 它 所 对 应 的 图 像 2 中 的 极 线 M 应 该 出 现在 平面 QCC。 
与 图 像 2 平面 的 相交 处 。 事 实 上 ,对 更 多 的 图 像 1 中 的 图 像 点 ,它们 所 对 应 的 图 像 2 中 的 极 
线 所 在 的 平面 都 包含 线 C1C;。 这 条 线 会 在 某 个 (单个 ) 点 R 穿 过 图 像 2 平面 。 因 为 Ci 在 
CzR 上 ,所 以 根据 定义 ,R 是 投影 点 Ci 在 图 像 2 上 的 图 像 点 。 在 实际 中 ,有 可 能 R 不 处 在 
图 像 2 的 范围 中 ,但 一 定 在 包含 它 的 扩展 平面 上 。 


13-7 本质 矩 阵 的 推导 


名 题 面 : 

在 基于 立体 视觉 技术 的 双 目 成 像 系 统 中 ,利用 两 个 光 心 之 间 的 联系 以 及 两 个 光 心 分 别 
与 景物 点 之 间 的 联系 ,借助 景物 点 的 两 个 成 像 位 置 以 及 摄像 机 之 间 的 平移 和 旋转 矩阵 来 推 
导 本 质 矩 阵 。 

忌 解 析 : 

参见 图 解 13-7, 两 个 光 心 之 间 的 联系 和 两 个 光 心 
分 别 与 景物 点 之 间 的 联系 可 以 用 3 个 3-D 矢量 010;、 
OHW 和 O:WW 表示 ,W 的 两 个 成 像 位 置 可 用 xi = 二 [uw 
v1] 和 x 二 [us vj" 表示 ,两 个 摄像 机 之 间 的 平移 和 
旋转 矩阵 分 别 用 T 和 R 表示 。 

根据 图 解 13-7, 有 OW 二 x,010,;, ccT,OW cc 
Rx; ,注意 这 里 考虑 矢量 的 尺度 有 可 能 不 同 而 使 用 了 正 图 解 13-7 双 目 立体 视觉 
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比例 符号 (cc) ,如 果 引入 相应 系数 则 可 将 其 转换 成 等 号 。 上 述 3 个 矢量 是 共 面 的 ( 均 在 极 了 
面 上 ) ,所 以 应 满足 OW 。 (010; XO,W) 二 0。 将 上 述 3 个 矢量 用 xz 、T 和 R 替换 ,就 得 
到 xf (TX Rxz) 二 xiExs 一 0。 这 就 是 需要 的 结果 ,其 中 E 是 本 质 矩 阵 。 


13-8 ”景物 表面 倾斜 的 问题 


各 题 面 : 

在 基于 区 域 相关 的 立体 匹配 中 , 隐 含 了 一 个 假设 条 件 : 与 匹配 模板 对 应 的 图 像 平面 是 
与 景物 的 可 见 局 部 表面 平行 的 。 

(1) 如 果 不 满足 这 个 条 件 , 会 对 立体 匹配 带 来 什么 问题 ? 

(2) 有 什么 办 法 可 解决 这 个 问题 ? 

各 解析 : 

(1) 考虑 如 图 解 13-8 的 示意 图 ,这 是 在 XZ 平面 
上 ,与 两 个 成 像 平面 I 和 I, 不 平行 景物 的 可 见 局 部 
表面 W 在 I 和 1, 上 的 投影 长 度 l, 和 1, 是 不 一 样 长 
的 。 可 见 景物 表面 的 倾斜 会 导致 两 个 成 像 平面 上 的 
投影 尺寸 不 同 ,如 果 用 同样 尺寸 的 模板 进行 匹配 , 它 
们 将 对 应 大 小 不 同 的 景物 区 域 。 这 会 对 立体 匹配 带 
来 一 定 的 偏差 。 图 解 13-8 与 成 像 平面 不 平行 的 景物 

(2) 解决 这 个 问题 可 以 使 用 两 次 计算 的 方法 。 可 见 局 部 表面 
用 第 一 次 计算 估计 出 的 视差 值 来 调整 (变形 ) 匹 配 窗 
口 以 补偿 两 幅 图 像 对 应 不 同 大 小 景物 区 域 的 问题 。 例 如 ,对 每 个 图 像 1 中 的 矩形 可 通过 
使 用 矩形 中 心 的 视差 以 及 视差 在 矩形 中 的 变化 信息 而 在 1; 中 确定 一 个 对 应 的 矩形 。 通 
过 一 个 优化 程序 来 最 大 化 五 中 矩形 与 中 矩形 之 间 的 相关 性 ,并 借助 插值 提取 I 中 的 
匹配 值 。 








13-9 相对 深度 误差 


如 题 面 : 
在 基于 立体 视觉 技术 的 双 目 成 像 系统 中 ,相对 深度 计算 的 误差 与 哪些 因素 有 关 ? 是 什 
么 关系 ? 
气 解 析 : 
根据 视差 D 可 以 计算 出 深度 距离 Z(B 为 基线 长 度 ,) 为 镜头 焦距 ): 
= 入 
两 边 对 D 求 导 : 


所 以 ,计算 相对 深度 的 误差 可 写成 
Ei | 要 4 
区 











» 58 < 


可 见 ,对 相对 深度 计算 的 误差 与 深度 距离 Z 和 视差 计算 的 误差 |dD| 都 成 正比 ,而 与 基 
线 长 度 B 和 镜头 焦距 4 都 成 反比 。 


13-10 水 平 四 目的 期 望 值 曲 线 


各 题 面 : 
考虑 如 图 题 13-10 所 给 出 的 f(x) 曲线 ,其 表达 式 为 : 


2 十 cos(Czr/4)， 一 4<< 工 二 12 
f(x) = 
ZX<—4,rz 宇 12 


现在 使 用 一 个 具有 水 平 四 目的 立体 视觉 系统 来 采集 图 像 。 ”ju 
它 共 有 3 条 基线 ,对 应 基线 Bi 的 di 二 5, 对 应 基线 Bs 的 d;, 一 3 
1. 5d1 ,对 应 基线 Bs 的 ds 二 2di。 换 句 话说 ,第 一 目 分 别 与 男 三 
目 构成 了 3 个 双 目 成 像 系 统 。 试 根据 倒 距离 的 SSD, 做 出 期 望 
值 ELSu (zx; #)]\ELSis (xz; 1)] 和 ELS,s(x; 1)] 的 曲线 。 进 一 
步 ,将 3 个 倒 距离 的 SSD 函数 相 加 以 得 到 倒 距 离 的 SSSD, 做 出 
期 望 值 ELS/®.s) (zs 四 ] 的 曲线 。 

要 解析 : 

对 应 3 条 基线 的 倒 距离 SSD 的 期 望 值 曲线 ELS (zx; DD]、E[LS,is (zx; 四 ] 和 E[Sis(zx; 门 ] 分 
别 如 图 解 13-10(a) 、 图 解 13-10(b) 和 图 解 13-10(c) 所 示 。 可 见 ,3 条 曲线 的 周期 都 不 相同 。 

对 应 倒 距 离 SSSD 的 ELSi 吕 (x; 1)] 的 期 望 值 曲线 如 图 解 13-10(d) 所 示 。 它 在 正确 匹 
配 位 置 会 达到 全 局 最 小 值 ,而 在 其 他 虚假 匹配 位 置 仅 能 取得 极 小 值 。 


20 we 


图 题 13-10 f(x) 曲线 
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E[Si(x;)] ELSna(x;)] 
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图 解 13-10 ”各 个 期 望 值 曲线 
。154。 


13-11 单方 向 多 目 立 体 视觉 


各 题 面 : 
与 使 用 双 目 立体 视觉 技术 进行 3-D 重建 时 相 比 ,使 用 单方 向 多 目 立 体 视觉 技术 时 又 增 
加 了 哪些 影响 重建 精度 的 因素 ? 
如 解析 : 
使 用 单方 向 多 目 立 体 视觉 技术 ,需要 将 对 应 M 个 倒 距 离 的 SSD 进行 求 和 计算 。 每 个 
SSD 可 表示 为 
Silzs BH) = DU ft) — flrt+ Ba Boa) ti]+m(rt)) nzrtd t+) 


jEW 
对 其 中 的 f[z 十 BA (去 一 上 二) 十 门 用 泰勒 级 数 展开 ,再 代 回 去 ,得 到 
Silzs Bi)= > (jz 十 力 BA (fot) t+n(zrt)) —n(rt+ Bar+))? 


jEW 








= {BA (圭一 让) Dt{ flrt+))) +2BA Got) Df Lilzt)) — 
jEW 


jEW 


ni(ZX 十 BX 在 十 让] 十 ps n(xz+7)—n(z+BAF+))) 


jEW 
最 优 的 值 应 满足 





可 ni 葡 和 

a 
at jEW 

2BA Df (r+))[no (z+ 站 一 n(x 十 BA 十 让] 
jEW 


解 得 
Df z+) (zt) —n(zt BAtt+i)] 


tf ti; a 








BA > [f(z+7)] +2BA 
jEW 


这 样 ,E()==#i, 而 


var Bf ert nrt)) —n(rt BAA + 让] 


jEW 





var(f) 





3 rre+D 


jEW 
可 见 , 影 响 重 建 精度 的 因素 包括 各 基线 的 长 度 、 镜 头 的 焦距 图像 在 窗口 中 强度 的 变化 
以 及 噪声 的 方差 。 


ea 5 s 








景物 重 构 的 目标 也 是 恢复 从 3-D 空间 向 2-D 像 平面 投影 成 像 中 丢失 的 信息 ,以 重建 
3-D 世界 。 与 立体 视觉 使 用 两 个 或 多 个 摄像 机 ( 双 目 或 多 目 ) 不 同 , 景 物 重 构 的 方法 一 般 特 
指 仅仅 使 用 一 个 (固定 ) 摄 像 机 来 采集 图 像 的 方法 ,所 以 也 称 为 单 目 方法 。 单 目 方法 根据 实 
际 中 采集 了 单 幅 或 者 多 幅 图 像 又 可 以 分 为 使 用 单 目 多 幅 图 像 进行 景物 重 构 的 技术 和 使 用 单 
目 单 幅 图 像 进行 景物 重 构 的 技术 。 

使 用 单 目 多 幅 图 像 的 方法 将 所 得 到 的 图 像 中 的 2-D 宛 余 信息 转化 为 3-D 的 信息 ,所 以 
借助 单 目 多 幅 图 像 中 的 信息 可 以 确定 景物 的 表面 朝向 (这 是 景物 的 本 征 特性 )。 由 景物 的 表 
面 朝 向 可 直接 得 到 景物 各 部 分 之 间 的 相对 深度 ,在 实际 中 也 常常 可 进一步 获得 景物 的 绝对 
深度 。 另 一 方面 ,要 使 用 单 日 单 幅 图 像 来 完成 这 样 的 工作 就 需要 借助 其 中 的 各 种 3-D 线索 
或 先 验 知识 。 

在 景物 的 各 种 本 征 特 性 中 ,3-D 景物 的 形状 是 最 基本 和 最 重要 的 。 一 方面 ,目标 的 许多 
其 他 特征 ,如 表面 法 线 、 物 体 边界 等 都 可 以 从 形状 推出 来 ; 男 一 方面 ,人 们 一 般 是 先 用 形状 
来 定义 目标 ,在 此 基础 上 再 利用 目标 的 其 他 特征 进一步 描述 目标 。 各 种 从 不 同 的 景物 特性 
出 发 来 恢复 景物 形状 的 方法 常常 被 冠 以 "从 X 得 到 形状 "的 名 称 ,这 里 的 X 可 以 代表 照度 变 
化 .阴影 .焦距 ,轮廓 ,纹理 ,景物 运动 等 。 典 型 的 多 幅 图 像 技术 包括 光度 立体 学 (也 称 光 移 )、 
从 ( 光 流 ) 运 动 求 取 结 构 等 ; 典型 的 单 幅 图 像 技术 包括 从 影 调 恢复 形状 、 由 纹理 变化 恢复 朝 
向 ,由 焦距 确定 深度 和 根据 三 点 透视 估计 位 姿 等 。 

本 章 的 问题 涉及 上 述 景物 重 构 多 个 方面 的 概念 。 


14-1 镜面 反射 强度 计算 


如 题 面 : 

设 有 一 个 理想 镜面 反射 表面 (反射 系数 为 0.8) 的 椭 球 状 物体 : x?/4 十 y*/4 十 x?/2 二 1。 
如 果 入 射 光 强 为 10, 那 在 (1, 1) 处 观察 到 的 反射 光 强度 尽 是 多 少 ? 

名 解析 : 

因为 是 理想 镜面 反射 表面 ,所 以 入射 角 与 反射 角 相 等 。 由 椭 球 状 物 体 的 方程 可 知 


所 以 表面 梯度 : 

















令 目 标 表 面 法 线 与 镜头 方向 之 间 的 夹 角 为 9。 当 目标 相当 接近 光 轴 时 ,从 目标 到 镜头 
的 单位 观察 矢量 可 认为 是 [0 0 1]7 ,所 以 cos9==1/(1 十 声 十 g)。 因 为 反射 光 强度 二 入 射 
光 强 度 X 反 射 系数 X cos0, 所 以 








2 2 R 
x3/16 /16 Re 16VZ 
woxo.s/f | F/T RT 8 


14-2 ”理想 散射 表面 的 反射 强度 














各 题 面 : 

设 有 一 个 具有 理想 散射 表面 ( 朗 伯 表面 ) 的 半球 面 ,其 反射 系数 为 r、 半 径 为 4d。 当 入 射 
光线 和 观察 视线 均 在 半球 正 上 方 时 , 求 反射 强度 的 分 布 。 据 此 能 和 否 确定 该 半球 面 是 凸 或 凹 
的 ? 如 果 不 能 ,还 需要 计算 什么 ? 














各 解析 : 
入 射 光线 在 半球 正 上 方 , 则 光源 矢量 为 [一 p,， 一 q;，1J" 一 [0，0，1] ,所 以 反射 强度 
Ep = 1+p.p+ gg Ey 1 六 
1+pr+g Vit+pi + 1+p’+g 1+d 


这 是 一 个 在 中 心 处 最 亮 , 且 随 着 与 中 心 距离 的 增加 而 逐渐 变 暗 的 2-D 分 布 。 无 论 半 球面 是 
凸 或 止 的 ,反射 光 强 的 分 布 是 一 样 的 ,所 以 仅 根据 反射 强度 的 分 布 ,并 不 能 确定 半球 面 的 凸 
或 止 。 
考虑 半球 面 所 在 的 球面 方程 : ?== 十 y? 十 ,可 见 对 同上 半球 面 或 目下 半球 面 分 别 有 
z a rz —y 
因为 对 球面 上 任 一 个 面 元 ,其 在 x 和 两 个 方向 的 梯度 分 别 为 p= 二 9z/9z 和 9 一 9z/ay, 所 以 
根据 任 一 个 梯度 的 方向 (对 应 偏 导 的 不 同 符号 ) ,就 可 以 确定 球面 是 凸 或 上 四 的 。 


14-3” 朗 伯 表 面 夹 角 与 亮度 








忌 题 面 : 

假设 有 一 个 由 朗 伯 表面 (理想 散射 表面 ) 材 料 构成 的 多 面体 ,让 其 中 一 个 表面 A 对 准 远 
处 的 光源 S ,观察 与 表面 A 相 邻 的 表面 B。 如 果 看 上 去 表面 B 的 亮度 为 (直接 观察 ) 表 面 A 
的 亮度 的 一 半 ,那么 表面 A 和 表面 B 之 间 的 法 线 夹 角 是 多 少 ? 

后 解析 : 

可 以 有 不 同 的 方法 ,例如 ， 

GD 参见 图 解 14-3, 表 面 A 的 法 线 与 光线 方向 一 致 ，“ 油 
表面 A 的 亮度 是 表面 B 的 亮度 的 两 倍 : LA 一 2Ls。 亮 度 的 


差别 源 自 两 个 表面 法 向 的 夹 角 9, 即 La/La 一 1/2 二 cos0, 所 
以 夹 角 是 60"。 < 


(2) 对 于 朗 伯 表 面 ,其 亮度 L 和 照度 EE 满足 关系 : 工 一 Nay © 
E/x。 考 虑 到 表面 的 朝向 ,L 二 Ecos0/x。 现 在 已 知 La 一 
Ecos0"/x 二 E/x,Ls 二 Ecos90/x 二 E/2x, 所 以 夹 角 9 为 60"。 


Na 
图 解 14-3 ”表面 照明 示意 图 


a 


14-4 理想 散射 表面 性 质 


各 题 面 : 

(1) 说 明理 想 散 射 表 面 ( 朗 伯 表面 ) 亮 度 的 变化 情况 。 

(2) 证 明 对 一 个 给 定 的 表面 亮度 ,在 理想 散射 表面 上 任意 点 的 朝向 都 在 一 个 特定 的 方 
向 锥 上 。 

(3) 证 明 至 少 需要 3 个 独立 的 光源 以 确认 一 个 理想 散射 表面 的 准确 朝向 。 

吕 解 析 : 

(1) 理想 散射 表面 的 亮度 源 于 其 反射 光 , 它 只 是 入 射 角 i 的 一 个 函数 ,其 强度 正比 于 
cosi 与 一 个 常数 反射 系数 (双向 反射 分 布 函数 ) 的 乘积 。 

(2) 对 给 定 的 反射 光 强 度 T, 和 人 射 角 满 足 cosi 二 CXIT,C 是 一 个 常数 。 因 此 ,i 也 是 一 个 
常数 。 所 以 ,表面 法 线 方向 全 部 都 在 一 个 圆锥 上 ,该 圆锥 的 半角 是 i, 且 以 入 射 光 方 向 为 中 
心 。 换 句 话说 ,所 有 表面 法 线 都 处 在 一 个 围绕 入 射 光线 方向 的 圆锥 上 ,如 图 解 14-4(1) 
所 示 。 

(3) 使 用 3 个 独立 的 光源 (它们 不 处 在 同一 条 直线 上 ,上 且 互 相 之 间 不 遮挡 ) 顺 序 地 照射 
理想 散射 表面 可 以 获得 3 幅 图 像 。 每 幅 图 像 上 有 一 个 理想 散射 表面 法 线 所 在 的 方向 圆锥 。 
各 个 表面 法 线 一 定 与 3 个 方向 圆锥 中 的 每 一 个 都 有 共同 的 顶点 : 两 个 圆锥 有 两 条 交 线 ,如 
图 解 14-4(2) 所 示 ,而 第 三 个 (独立 的 ) 圆 锥 就 将 把 范围 减少 到 单条 线 , 从 而 能 对 表面 法 线 的 
方向 给 出 唯一 的 解释 和 估计 。 


T 





人 入射 光线 





图 解 14-4(1) 理想 散射 表面 法 线 所 在 的 方向 圆锥 图 解 14-4(2) ”两 个 方向 圆锥 有 两 条 交 线 


如 果 表 面 的 绝对 反射 系数 尽 未 知 , 仅 3 个 独立 的 光源 一 般 会 不 够 用 。 但 是 ,如 果 3 条 
光线 互相 正 交 , 则 相对 于 各 个 轴 夹 角 的 余弦 和 是 1, 即 此 时 只 有 两 个 角度 是 独立 的 ,所 以 由 3 
组 数据 还 可 确定 R 以 及 两 个 独立 的 角度 ,于 是 就 可 以 得 到 完全 的 解 。 在 其 他 情况 下 ,为 消 
除 歧义 ,会 需要 考虑 至 少 4 个 独立 的 光源 。 


14-5 ”摄像 机 运动 参数 


各 题 面 : 
给 定 两 帧 在 相 邻 时 刻 拍摄 的 图 像 , 试 根据 像素 亮度 变化 ,计算 摄像 机 运动 的 参数 。 
气 解 析 : 


这 里 设 光源 和 场景 都 没有 随时 间 变 化 ,所 以 像素 亮度 变化 仅仅 是 由 于 摄像 机 运动 而 产 
“ SB 


生 的 。 设 用 z(t) 和 y(?) 表 示 空 间 点 卫 在 时 刻 t 的 图 像 坐标 , 则 在 :十 dz 时 刻 ,P 点 所 对 应 的 


新 图 像 坐标 为 
X(t dt) | fe Ts 
es 区 上 对 co bl 
其 中 .0、T, 和 T, 对 应 摄像 机 运动 参数 ,k 表示 尺度 变化 ,9 表示 摄像 机 的 旋转 角 ,T, 和 T， 
表示 摄像 机 的 平移 量 。 空 间 点 P 的 运动 速度 为 
z] dz/dz 1 一 1 人 z(t) / 
es en Eo 一 ee 
代入 光 流 方程 ,得 
(fztf rR— D+ fr— fy M+fT 十 放 T, 十 所 =0 
由 于 摄像 机 的 运动 导致 所 有 图 像 像素 ( 设 共 N 个 ) 发 生 相 同 的 变化 ,所 以 可 得 
fA=B 
其 中 了 为 NX4 的 矩阵 ,每 一 行为 [fz 十 fyy ,fyz 一 fyy,f，fy]; 4 为 1X4 的 矢量 [k 一 1， 
k0,T,,，T,]"; B 为 NX1 的 矢量 ,其 中 每 个 元 素 等 于 一 f,。 由 于 f;、f,、f 均 可 从 图 像 中 算 
得 ,所 以 可 得 到 了 和 B。 最 后 ,利用 最 小 二 乘法 可 解 得 
A= (fH 7'B 
据 此 就 可 计算 随 像素 亮度 变化 (包括 空间 变化 和 时 间 变 化 ) 的 摄像 机 的 运动 参数 。 


14-6 镜头 的 焦距 和 景深 











各 题 面 : 

一 个 镜头 的 孔径 为 20mm, 可 以 容忍 的 模糊 圆 的 直径 为 mm。 当 镜头 的 焦距 为 50mm 
时 ,景深 为 多 少 ? 如 果 镜 头 的 焦距 分 别 为 150mm 和 500mm 呢 ? 

后 解 析 : 

在 3 种 情况 下 ,景深 Ad。 都 是 物 距 d。 的 函数 (其 他 参数 均 已 知 )。 图 解 14-6 给 出 3 种 情 
况 下 景深 Ad。 随 物 距 d。 而 变化 的 曲线 。 由 图 可 见 , 当 焦距 比较 大 时 ,景深 Ad。 基 本 随 物 距 d。 
线性 增加 ,而 当 焦距 比较 小 时 ,景深 Ad。 会 随 物 距 d。 加 速 增加 。 

10 000 








8000 























图 解 14-6 景深 随 物 距 而 变化 的 曲线 (以 焦距 为 参数 ) 
mw L509 < 


14-7 ”摄像 机 倾斜 成 像 的 变形 


各 题 面 : 

借助 摄像 机 运动 可 获得 对 同一 景物 的 多 幅 不 同 图 像 。 现 将 一 个 摄像 机 悬挂 在 距离 铺 满 
了 方形 瓷砖 的 地 面 2m 高 的 位 置 , 先 向 正 下 方 拍摄 一 幅 图 像 , 然 后 把 摄像 机 垂直 倾斜 一 定 角 
度 后 再 拍摄 一 幅 图 像 。 已 知 第 二 次 成 像 后 的 瓷砖 图 像 为 长 高 比 为 10 : 9 的 矩形 , 求 摄像 机 
转 过 的 角度 。 

扣 解 析 : 

不 失 一 般 性 ,将 世界 坐标 系 取 为 与 摄像 机 坐标 系 重合 来 进行 分 析 。 这 里 仅 考虑 摄像 机 
在 YOZ 平面 内 绕 视线 偏转 (垂直 倾斜 ) 的 情况 (在 XOZ 平面 内 类 似 )。 设 方形 瓷砖 的 边 长 
为 1, 则 第 一 次 成 像 得 到 的 图 像 如 图 解 14-7(a) 所 示 。 摄 像 机 的 偏转 可 以 有 正 负 两 个 方向 ， 
所 以 得 到 的 图 像 将 可 能 如 图 解 14-7(b) 或 图 解 14-7(c) 所 示 , 其 路: H=10 : 9。 


I 





| 


0 L 
(a) 





(0) 
图 解 14-7 不 同情 况 下 的 瓷砖 图 像 


因为 偏转 后 的 瓷砖 图 像 的 长 宽 比 为 10 : 9, 所 以 偏转 的 角度 应 是 arccos(9/10) 一 
25. 84"; 考虑 到 对 称 性 ,摄像 机 旋转 的 角度 可 以 是 25. 84 和 一 25. 84 (分 别 对 应 
图 解 14-6(b) 和 图 解 14-6(c) ) 。 


14-8 ”从 影 调 恢复 形状 与 双 目 立体 视觉 


如题 面 : 

对 比 从 影 调 恢复 形状 的 方法 所 得 到 的 朝向 图 与 双 目 立体 视觉 的 方法 所 得 到 的 深度 图 。 
这 两 种 方法 最 适用 于 哪些 应 用 ? 如 果 将 它们 与 结构 光 成 像 的 方法 相 结 合 , 会 有 什么 变化 ? 

各 解析 : 

朝向 图 反映 的 是 相对 深度 信息 ,而 深度 图 给 出 绝对 深度 信息 。 原 则 上 讲 ,如果 有 一 个 参 
考点 , 则 从 相对 深度 信息 出 发 也 可 以 获得 绝对 深度 信息 ,但 常常 需要 很 多 计算 。 

两 种 方法 各 自 适合 不 同 的 应 用 : 从 影 调 恢复 形状 的 方法 最 好 应 用 于 具有 平滑 表面 的 景 
物 ,而 双 目 立体 视觉 的 方法 最 好 应 用 于 有 纹理 的 表面 或 有 很 多 特征 的 表面 。 

结构 光 成 像 方法 将 具有 一 定 结构 模式 的 光 作为 光源 , 借 此 能 在 景物 的 表面 构造 出 一 个 
粗糙 的 纹理 表面 。 如 果 将 它 与 双 目 立体 视觉 方法 结合 , 则 将 允许 双 目 立体 视觉 方法 也 在 平 
滑 的 表面 工作 ,但 这 样 得 到 的 结果 与 从 影 调 恢复 形状 方法 得 到 的 结果 不 完全 相同 。 





中 60's 


气 题 面 : 


14-9 影 调 与 结构 光 的 对 比 


在 物体 表面 显现 出 来 的 影 调 有 时 可 起 到 类 似 结构 光 的 作用 ,提供 一 些 表面 形状 的 信息 。 
试 对 比 从 影 调 恢复 形状 的 方法 与 使 用 结构 光 成 像 的 方法 的 特点 ,指出 它们 的 相同 之 处 和 不 


同 之 处 。 
气 解析 : 


对 比 的 项 目 和 结果 见 表 解 14-9。 
表 解 14-9 ” 影 调 与 结构 光 在 重建 中 的 对 比 


















































对 比 项 从 影 调 恢复 形状 结构 光 成 像 
方法 类 型 间接 恢复 相对 深度 (形状 7 直接 获取 绝对 深度 
利用 信息 图 像 灰 度 分 布 信息 照明 几何 信息 (转换 为 景物 几何 信息 ) 
测量 手段 被 动 接受 3-D 到 2-D 的 投影 结果 主动 三 角 测 距 
光源 固定 ,任意 类 型 固定 /转动 ,可 调制 图 案 , 事 先 标 定 
采集 器 固定 ,单个 位 置 固定 /转动 ,单个 位 置 ,事先 标定 
景物 固定 固定 /转动 
采集 图 数量 单 幅 单 幅 /多 幅 
环境 光影 响 过 强 / 过 弱 时 影响 较 大 过 强 时 (对 图 案 ) 影 响 较 大 
表面 纹理 影响 纹理 会 干扰 影 调 一 般 影响 较 小 
计算 复杂 度 相对 较 高 相对 较 低 
精度 相对 较 低 相对 较 高 
约束 条 件 不 足 (病态 ) , 需 添 加 额外 条 件 不 需 额外 约束 
相 异 处 建立 表面 朝向 与 图 像 亮度 的 联系 建立 表面 朝向 与 图 案 畸 变 的 联系 
相同 处 均 可 用 于 从 2-D 图 像 获取 3-D 景物 信息 

14-10 ”纹理 平面 的 朝向 
气 题 面 : 


一 个 平面 上 布 满 了 圆 形 图 案 , 可 看 作 圆 形 纹理 基 
元 。 如 果 对 平面 成 像 ,只 有 当 摄像 机 轴线 与 平面 法 线 
平行 , 圆 形 图 案 仍 然 保 持 圆 形 ; 其 他 情况 下 圆 形 图 案 
成 为 椭圆 形 , 如 图 题 14-10 所 示 。 

(1) 如 果 由 圆 形 纹理 基 元 得 到 的 椭圆 形 的 长 宽 比 
为 2: 1, 那么 基 元 所 在 平面 的 朝向 是 怎样 的 ? 

(2) 如 果 椭 圆 长 轴 与 X 轴 的 夹 角 为 30" ,那么 基 元 
所 在 平面 的 朝向 又 是 怎样 的 ? 


名 解析 : 


(1) 椭圆 的 长 轴 和 短 轴 分 别 为 : Dssor (0,0) 二 4D/Z; Dinor(0,0) 二 ADecosa/Z。 所 以 





图 题 14-10 ” 圆 形 纹理 基 元 平面 

















» OL % 


Dsio: (0，0)/ Dinor(0, 0) 二 2/1, 得 cosa 二 1/2, 即 a 二 60"。 此 时 图 形 纹 理 基 元 所 在 的 平面 与 
Y 轴 的 夹 角 为 60”。 
(2) 设 圆 形 纹理 基 元 所 在 平面 的 方程 为 az 十 by 十 cz 十 d 二 0, 则 将 圆 形 投 影 到 倾斜 平面 
上 所 得 到 的 椭圆 方程 为 
[+621 zs] [CG +e na] tr2abry 一 cz 一 | 
如 果 将 椭圆 中 心平 移 到 原点 , 取 c 王 1,d 一 0, 则 上 述 方程 只 剩 下 .Or 这 3 个 未 知 数 。 现 在 
已 知 椭圆 长 轴 与 X 轴 的 夹 角 为 30°, 可 以 写 出 该 椭圆 包含 a 和 6b" 两 个 未 知 数 的 方程 。 通 过 
对 比 两 个 椭圆 方程 中 的 zx? zy 和 y? 项 ,可 以 列 出 3 个 方程 , 即 可 以 解 出 a、b、r 的 值 。 从 而 
可 以 得 到 基 元 所 在 平面 的 朝向 。 


14-11 圆 变形 后 的 椭圆 长 短 轴 
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如 题 面 : 

圆 在 投影 成 像 时 一 般 会 变形 为 椭圆 (长 短 轴 之 间 的 比例 不 为 1) 。 以 圆 形 为 纹理 基 元 的 
平面 在 3-D 空间 中 可 能 相对 于 视线 发 生 倾斜 ,还 可 能 相对 于 摄像 机 轴线 发 生 旋转 。 试 推导 
用 来 计算 处 在 任意 位 置 和 任意 朝向 的 圆 形 纹理 变形 后 的 椭圆 长 短 轴 的 公式 。 

要 解析 : 

设 物 体 在 以 摄像 机 光 心 为 原点 , 且 在 光 轴 垂直 于 圆 形 所 在 平面 的 坐标 系 中 的 坐标 为 
CX,Y，2Z) , 则 圆周 与 光 心 所 形成 的 斜 圆 锥 方程 为 (a 为 平面 与 X 轴 之 间 的 夹 角 ,8B 为 平面 与 
Y 轴 之 间 的 夹 角 ,y 为 平面 与 Z 轴 之 间 的 夹 角 ) : 

(X—aZ):+(Y—Pp2) = YZ 
设 物 体 点 在 摄像 机 坐标 系 中 的 坐标 为 (zx,，y， xz) , 则 


X al al als][ 并 
Y|=|an az az |ly 
Z U31 Ud32 4d33 


投影 所 成 的 椭圆 方程 可 写成 : 
(二 —r)r +2(k np—r)ryt+ (+p ms)y +2(km+ng—rn)zr+ 
2(1m++pgq—st)y+m +gq t=0 














R 一 al 一 如 3 n=aa— saa, r= aa 
l= a — tas, p= a sd. 5 一 032 
m= (as—tas)A, 9g 一 (az — sa433)A, t= Q33A 


而 4 为 摄像 机 焦距 。 联 立 上 述 方程 可 确定 各 个 参数 。 
在 此 基础 上 ,可 以 确定 圆 形 纹理 基 元 变形 后 的 椭圆 形 的 长 短 轴 


了 DasocCzyy) 一 人 9a — tanytana 一 tanAtanB) 


Druinor (XT,y) = A cosacosp (1 一 tanytana 一 tanytanB)? 


人 





借助 立体 视觉 方法 恢复 3-D 信息 以 及 借助 从 X 恢复 形状 技术 重 构 景 物 还 只 是 实现 了 
图 像 理 解 第 一 个 层次 的 目标 。 在 此 基础 上 ,图 像 理 解 第 二 个 层次 的 目标 是 对 图 像 高 层 的 含 
义 给 出 明确 的 解释 。 在 这 个 层次 上 ,需要 通过 学 习 、 推 理 与 模型 的 匹配 等 方式 来 解释 客观 
场景 的 内 容 特性、 变化 态势 或 趋向 等 。 

场景 解释 是 一 个 非常 复杂 的 过 程 , 为 此 需要 将 人 类 的 知识 引入 理解 过 程 。 知 识 是 先前 
人 类 对 客观 世界 的 认识 成 果 和 经 验 总 结 , 它 可 以 指导 当前 对 客观 世界 新 变化 的 认识 和 理解 ， 
在 整个 视觉 过 程 的 各 个 阶段 都 起 着 重要 的 作用 。 借 助 对 知识 的 利用 可 以 有 效 地 提高 图 像 理 
解 的 可 靠 性 和 效率 ,对 场景 的 解释 就 需要 根据 已 有 的 知识 并 借助 推理 来 进行 。 

理解 图 像 和 理解 场景 是 一 项 复杂 的 工作 ,包括 感觉 /观察 ,场景 恢复 ,匹配 认 知 、 场 景 解 
释 等 过 程 。 其 中 匹配 认 知 试图 通过 匹配 把 未 知 与 已 知 联系 起 来 ,进而 用 已 知 解释 未 知 。 对 
场景 的 解释 是 一 个 不 断 认 知 的 过 程 ,所 以 需要 将 从 图 像 中 获得 的 信息 与 已 有 的 解释 场景 的 
模型 进行 匹配 。 也 可 以 这 样 说 ,感知 是 把 视觉 输入 与 事前 已 有 表达 结合 的 过 程 ,而 认 知 也 需 
要 建立 或 发 现 各 种 内 部 表达 式 之 间 的 联系 。 匹 配 就 是 结合 各 种 表达 和 知识 ,建立 这 些 联系 ， 
从 而 解释 场景 的 技术 或 过 程 。 

对 一 个 复杂 的 图 像 理 解 系统 , 它 的 内 部 常常 同时 存在 着 多 种 图 像 输 入 和 其 他 知识 共存 
的 表达 形式 。 匹 配 借助 储存 在 系统 中 的 已 有 表达 和 模型 去 感知 图 像 输 入 中 的 信息 ,并 最 终 
建立 与 外 部 世界 的 对 应 性 ,实现 对 场景 的 解释 。 匹 配 可 以 在 像素 层 进行 (图 像 匹配 ) ,也 可 以 
在 目标 层 进 行 (目标 匹配 ) ,还 可 以 在 更 抽象 的 目标 层 和 概念 符号 层 进行 (广义 匹配 ) 。 

本 章 的 问题 涉及 上 述 知 识 和 匹配 多 个 方面 的 概念 。 


15-1 逻辑 等 价 关 系 


各 题 面 : 

试 证 明 下 列 逻 辑 连接 符 组 合 的 等 价 关系 ( 德 摩根 定律 ,交换 律 ,结合 律 ,分 配 律 ): 
(Qe Ch A Bs A Va Bs 

Ca Ch VY B= A ANB; 

(WANBSBAA; 

(M4)AVBeSBYV A; 

(AN BNC NBNO: 

(6) (AVBVCeAVY (BV DO; 

(I) ANBYO AAAN BV OGAAC) 


(8) AVI(CBACcAVB)ACAYVOC)。 
用 解析 : 
逻辑 连接 符 的 真 值 如 表 解 15-1 所 示 。 


表 解 15-1 逻辑 连接 符 的 真 值 表 





序号 | 4 | Bs | ~a [| aAB | AvB | A428 
(0 T 金 F . 下 下 
©® T F F F T F 
@ F 于 下 F 下 TT 
四 F F T F F T 





为 证 明 各 个 等 价 关 系 所 使 用 的 真 值 借助 序号 列 在 各 等 价 关 系 后 : 
(D~(AABe~AV~B:O0,0 :0,0,0; 
(2)~(AVB)e~AA~B:O,O0 -0,0.,0; 
(3)AAB<B A 人 4:0O 0D; 

(WAVBSBV A:OQO 0; 

(5)(AAB)ACeAAN BAO: O09 <0,0; 

(6) (AVB)VCeAYVY (BVO:OD,OD 0,0; 
(AAC(BVCOC) ANB VY AAO: DD e000,0; 
(8)AV BAC AV BA AYO: OD,OD 0,0,0, 


15-2 目标 分 类 知识 的 不 同 表 达 


如 题 面 : 
一 幅 图 像 中 有 两 类 尺寸 不 同 的 圆 目标 ,它们 直径 的 均值 分 别 为 4d 和 ds ,而 方差 分 别 为 
vi 和 Vso 

(1) 用 类 英语 句子 列 出 可 将 这 两 类 目标 分 开 的 知识 。 

(2) 用 语义 网 表达 这 些 知 识 。 

(3) 用 专家 系统 规则 表达 这 些 知识 。 

各 解析 : 

(1) OBJECT_MEAN (Objectl, di1) 
OBJECT_MEAN (Object2, d;,) 
OBJECT_VARIANCE (Objectl, w) 
OBJECT_VARIANCE (Object2, w) 

(2) 表达 这 些 知 识 的 语义 网 如 图 解 15-2 

所 示 。 
(3) 表达 这 些 知 识 的 专家 系统 规则 (这 里 设 两 类 目标 出 现 的 概率 相等 ): 


if zx isa round and 





图 解 15-2 表达 知识 的 语义 网 


d(x) is diameter of (x) and 
d(x) small than (di + d2)/2 


“ 4 语 


then x _ belongs to object 1 
else if d(xz) bigger than (di++d,)/2 


then x belongs to object 2 


15-3 ”模板 匹配 与 哈 夫 变换 


气 题 面 : 

模板 匹配 与 哈 夫 变换 之 间 有 什么 联系 ? 试 分析 比 较 它们 在 检测 共 线 点 时 的 计算 量 。 

气 解 析 : 

在 模板 匹配 中 ,检测 是 靠 将 模板 与 图 像 进行 相关 并 计算 最 大 值 来 进行 的 。 在 哈 夫 变换 
中 ,检测 是 靠 将 图 像 转化 到 参数 空间 并 计算 参考 点 来 进行 的 。 模 板 匹 配 时 需要 考虑 图 像 中 
的 所 有 像素 ,而 哈 夫 变换 时 只 需 ( 在 边缘 检测 的 基础 上 ) 考 虑 图 像 中 的 边缘 像素 。 

当 检测 共 线 点 时 ,模板 匹配 可 利用 线 状 模板 绕 着 每 个 像素 旋转 以 找到 最 大 响应 的 方向 ; 
而 哈 夫 变换 将 检测 共 线 点 的 问题 转化 为 在 参数 空间 中 检测 交 于 一 点 的 直线 的 问题 ,或 者 说 
在 参数 空间 寻找 聚 类 的 问题 。 设 图 像 要 检测 的 共 线 点 共有 N 个 (已 通过 边缘 检测 提取 出 
来 ) ,直线 的 方向 为 M 个 ,模板 尺寸 为 kXk, 则 模板 匹配 的 计算 量 正比 于 NMk?; 而 在 利用 
哈 夫 变换 时 , 则 计算 量 正比 于 NM( 即 方向 的 量化 值 为 M) 。 


15-4 形状 数 之 间 的 相似 距离 








扫 题 面 : 

对 两 个 区 域 边界 A 和 B ,证 明 用 它们 形状 数 的 相似 度 的 倒数 定义 的 距离 D(A,B)= 
1 从 是 一 个 ( 超 ) 距 离 量度 函数 , 即 它 满 足下 列 3 个 条 件 : 

(1) D(A, B) 宇 0(D(A, B)=0, 当 上 且 仅 当 A=B)。 

(2) DCA, B)=D(B, A). 

(3) D(A, B) 三 max[LD(A, C),D(B, C)], 这 里 C 是 任意 另 一 个 区 域 边界 。 

各 解析 : 

(1) 相似 度 & 是 两 个 区 域 边界 A 和 B 的 形状 数 之 间 的 最 大 公共 形状 数 , 即 总 为 正 整 
数 , 所 以 D(A, B) 二 0, 而 如 果 A 和 B 完全 相同 , 则 相似 度 为 无 穷 ,所 以 此 时 D(A,B)=0。 

(2) 两 个 区 域 边界 A 和 B 之 间 的 相似 度 是 互相 的 ,所 以 D(A, B)=D(B, A)。 

(3) 根据 D(A, B)==1/&, 可 将 D(A, B) 三 max[D(A, C),D(B, C)] 写 成 1/kap 夺 max 
[1/kacs,1/kscj, 进 一 步 还 可 写成 kap 宇 min[Lkac ,kscj]。 由 于 不 同形 状 区 域 的 边界 在 形状 数 
阶 数 最 低 时 总 是 相似 的 ,所 以 等 号 总 可 以 保证 ; 而 在 形状 数 为 较 大 阶 数 时 ,大 于 关系 有 可 能 
成 立 , 因 此 D(A, B) 三 max[LD(A, C),D(B, C)] 能 够 成 立 。 


15-5 关系 匹配 计算 


名 题 面 : 
关系 匹配 时 可 以 使 用 的 关系 有 很 多 种 。 现 在 仅 考虑 连接 关系 , 试 计 算 一 下 图 题 15-5 中 
» I 


两 个 物体 之 间 的 距离 ,以 判断 它们 匹配 的 程度 。 
各 解析 : 
图 题 15-5(a) 包 含 4 个 元 件 Q=={A,B,C， 
DD} ,其 连接 关系 为 : Ri 二 {(A,B) (A,C) (B,D) 
(CD SD XD RDR SA ER. 











图 题 15- So Te 区 ® 包 
连接 关系 为 : i 图 题 15-5 ”两 个 关系 物体 图 


igre re et tte tne 

设 S 到 TT 的 映射 变换 p= 二 {1(A,1) (B,2) (C,3) (D,4)},T 到 S 的 映射 变换 p71! 一 
{(1,A) (2,B) (3,C) (4,D)}。 这 样 得 到 RI@® p= 二 {(1,2) (1,3) (2,4) (3,4)} ,Rp '!'= 
(AB) AO ADILCBIDY CDN 

4 种 匹配 误差 分 别 为 ; 

E= {RIOp— (Rp) NER.) 

= (C2 C153 (05 CI — {C152 C13 C2 Bed} = 0 
已 = {R;— (Ri ©® p) NR.} 


= WL 
= {(1,4)} 
局 一 {R; @® p71! — (R:@) NNR) 
= (AB OASOY (AD) CB DY (CCIDD} = (ASBY AO) (B,DY (CD 
= {(A,D)} 
也 一 {Ri— (R; @F!) NR} 


(CASB) CACY BIDY (CD — A OA BY CAyCY CB DY CIDDY = 
用 误差 项 表示 : C(E1)==0,C(E,)=1,C(E;)=1,C(E,)=0。 
两 个 物体 间 的 距离 最 后 为 : discCR,R.) 一 2 


15-6 关系 匹配 中 的 计算 量 








艺 题 面 : 

关系 匹配 的 过 程 中 共有 4 个 步骤 ,它们 各 自 所 需 的 计算 量 是 怎样 的 ? 

如 解析 : 

第 一 个 步骤 是 要 确定 两 个 关系 集合 中 的 相同 关系 ,这 里 的 计算 量 与 两 个 关系 集合 中 基 
本 关系 的 数量 都 成 正比 。 如 果 设 一 个 关系 集合 中 有 m 个 关系 ,而 另 一 个 关系 集合 中 及 个 
关系 , 则 计算 量 正比 于 m Xn。 

第 二 个 步骤 是 要 确定 使 相同 关系 进行 匹配 的 对 应 映射 ,这 里 的 计算 量 与 映射 形式 的 数 
量 有 关 。 如 果 设 有 K 种 可 能 的 形式 , 则 对 映射 排序 的 计算 量 正比 于 K?。 

第 三 个 步骤 是 要 确定 匹配 关系 集中 的 对 应 映射 ,这 里 的 计算 量 与 映射 的 数量 成 正比 ,也 
与 关系 的 数量 成 正比 。 如 果 设 m 三 n, 则 只 有 wm 对 关系 有 对 应 ,所 以 计算 量 正比 于 mXK。 

第 四 个 步骤 是 要 确定 匹配 所 属 的 模型 ,这 里 的 计算 量 与 模型 的 数量 成 正比 。 如 果 设 模 
型 的 数量 为 荆 , 则 计算 量 正比 于 工 。 

。166 。 








总 的 计算 量 应 正比 于 mnKL。 
15-7 有色 图 的 同 构 


名 题 面 : 
图 有 3 种 同 构 情况 。 设 计 一 个 例子 ,讨论 有 色 图 对 应 的 3 种 同 构 情 况 。 


气 解 析 : 

有 色 线 图 中 不 仅 包含 结 点 集 , 而 且 包 含 结 点 色 性 集 ; 不 仅 包含 连 线 集 , 而 且 包含 连 线 色 
性 集 。 为 讨论 有 色 线 图 的 同 构 , 结 点 和 连 线 都 要 考虑 两 种 或 多 种 。 

下 面 借助 图 解 15-7 中 的 几 个 有 色 线 图 结构 来 讨论 。 这 里 结 点 有 两 种 (分 别 用 深 和 浅 两 
种 阴影 表示 ) , 连 线 也 有 两 种 (用 实 线 和 虚线 区 别 ) 。 





图 解 15-7 示例 有 色 线 图 


(1) 全 图 同 构 : 图 解 15-7(a) 和 图 解 15-7(b) 是 全 图 同 构 的 。 

(2) 子 图 同 构 : 图 解 15-7(a) 与 图 解 15-7(c) 中 的 两 个 子 图 是 同 构 的 : @ 由 结 点 A、C、 
D\E 及 它们 之 间 的 连 线 构成 的 子 图 ; 四 由 结 点 A、.B、D、 丰 及 它们 之 间 的 连 线 构成 的 子 图 。 

(3) 双子 图 同 构 : 图 解 15-7(a) 中 外 面 3 个 结 点 及 它们 之 间 的 连 线 构成 的 (三 角形 ) 子 
图 与 图 解 15-7(d) 中 的 两 个 子 图 是 双子 图 同 构 的 : @ 由 结 点 A、E、F 及 它们 之 间 的 连 线 构 
成 的 子 图 ; @ 由 结 点 B.C、D 及 它们 之 间 的 连 线 构成 的 子 图 。 


15-8 有 共同 顶点 的 子 图 


各 题 面 : 
一 个 图 如 图 题 15-8 所 示 , 画 出 它 的 所 有 以 {A, B,C, 了 )} 为 顶点 的 子 图 。 


E 宁 
图 题 15-8 需 画 出 子 图 的 图 


各 解析 : 
该 图 共有 16 个 以 {A, B, C, DD}) 为 顶点 的 子 图 , 见 图 解 15-8。 


» LP 


图 解 15-8 16 个 以 {A,，B，C，D)} 为 顶点 的 子 图 


15-9 计算 各 种 子 图 


如题 面 : 

给 定 如 图 题 15-9 所 示 的 图 G, 它 有 4 个 顶点 ,分 别 用 大 写字 母 A、.B、C、D 表示 ; 它 有 5 
条 连 线 ,分 别 用 小 写字 母 a.b、c.d、e 表示 。 请 利用 获得 基础 简单 图 的 4 种 
运算 计算 图 G 的 各 种 子 图 。 

(1) 计 算 图 G 的 所 有 包含 3 个 顶点 的 导出 子 图 。 

(2) 计算 图 G 的 所 有 包含 边 a 且 共 有 3 条 边 的 边 导出 子 图 。 


AR 





(3) 计算 图 G 的 所 有 包含 2 个 项 点 的 剩余 于 图 。 es 
(4) 计算 图 G 的 所 有 包含 2 条 边 的 生成 子 图 。 sa 
操 解析 : 


(1) 图 G 共 有 4 个 顶点 ,所 有 包含 3 个 顶点 的 导出 子 图 共 4 个 ,如 图 解 15-9(1) 所 示 。 


4 An 4 
b a VE 
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图 解 15-9(1) 图 G 的 4 个 包含 3 个 顶点 的 导出 子 图 


(2) 图 G 共 有 5 条 边 , 所 有 包含 边 a 共 3 条 边 的 边 导出 子 图 共 6 个 ,如 图 解 15-9(2) 
所 示 。 

(3) 图 G 共 有 4 个 顶点 ,去 掉 2 个 顶点 ,还 剩 2 个 顶点 ,所 有 包含 2 个 顶点 的 剩余 子 图 
共 6 个 ,如 图 解 15-9(3) 所 示 。 

(4) 图 G 共 有 5 条 边 ,去 掉 3 条 边 , 还 剩 2 条 边 ,所 有 包含 2 条 边 的 生成 子 图 共 10 个 ， 





* dR 


如 图 解 15-9(4) 所 示 。 





图 解 15-9(2) G 的 6 个 包含 边 a 且 共 3 条 边 的 边 导出 子 图 


图 解 15-9(3) 图 G 的 6 个 包含 2 个 顶点 的 剩余 子 图 
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图 解 15-9(4) 图 G 的 10 个 包含 2 条 边 的 生成 子 图 


15-10 图 同 构 和 子 图 同 构 


各 题 面 : 
指出 图 题 15-10 中 哪些 图 和 哪些 子 图 是 同 构 的 。 


(a) (b) (9) 


图 题 15-10 具有 相同 顶点 个 数 的 图 


» 009% 


各 解析 : 

为 说 明 方 便 , 先 对 图 题 15-10 的 3 个 图 中 的 各 个 顶点 标 上 号 ,如 图 解 15-10(1) 所 示 。 
这 里 ,对 图 题 15-10(a) 从 左上 角 开 始 分 两 圈 按 顺 时 针 顺 序 标号 ,外 圈 为 D0、@、@、@, 内 图 
为 @.@、\@, 对 图 题 15-10(b) 从 上 到 下 分 两 列 顺序 标号 , 左 列 依次 为 0、®@、@、@, 布 列 
依次 为 @.@ .四 .@; 对 图 题 15-10(c) 以 最 上 面 左 边 的 顶点 为 起 点 按 顺 时 针 顺 序 标号 ,依次 
为 0D0.O.O@OO.@.@.O.@. 





[0} @ 

图 @ 

© @ 
(a) (b) 


图 解 15-10(1) 具有 相同 顶点 个 数 的 图 


图 题 15-10(a) 和 图 题 15-10(b) 是 全 图 同 构 的 。 它 们 同 号 的 顶点 是 对 应 的 。 

图 题 15-10(a) 图 题 15-10(b) 和 图 题 15-10(c) 中 还 有 许多 双子 图 同 构 。 下 面 给 出 3 种 
双子 图 同 构 的 示例 (将 没有 参与 同 构 的 连 线 用 虚线 表示 )。 考 虑 到 对 称 性 ,每 种 仅 各 给 出 一 
个 示例 。 

(1) 在 图 解 15-10(2c) 中 , 取 两 个 对 顶 三 角形 为 一 个 子 图 ( 实 线 ) ,在 图 解 15-10(2a) 和 
图 解 15-10(2b) 中 都 可 以 找到 同 构 的 子 图 (对 应 标号 的 顶点 和 它们 之 间 的 实 线 ) 。 这 里 同 构 
的 子 图 实际 上 对 应 一 个 四 边 形 。 





(b) 
图 解 15-10(2) 对 应 一 个 四 边 形 的 子 图 
(2) 在 图 解 15-10(3c) 中 , 取 4 个 对 项 三 角形 为 一 个 子 图 ( 实 线 ) ,在 图 解 15-10(3a) 和 


图 解 15-10(3b) 中 都 可 以 找到 同 构 的 子 图 (对 应 标号 的 顶点 和 它们 之 间 的 实 线 )。 这 里 同 构 
的 子 图 实际 上 可 看 作 是 两 个 四 边 形 的 组 合 。 








图 解 15-10(3) 对 应 两 个 四 边 形 的 子 图 
(3) 在 图 解 15-10(4c) 中 , 取 6 个 对 顶 三 角形 为 一 个 子 图 ( 实 线 ) ,在 图 解 15-10(4a) 和 


TO 


图 解 15-10(4b) 中 都 可 以 找到 同 构 的 子 图 (对 应 标号 的 顶点 和 它们 之 间 的 实 线 )。 这 里 同 构 
的 子 图 实际 上 可 看 作 是 3 个 四 边 形 的 组 合 。 





图 解 15-10(4) 对 应 3 个 四 边 形 的 子 图 


需要 指出 ,由 上 述 逐 步 进行 双子 图 同 构 的 过 程 和 结果 可 以 看 出 两 点 : 图 题 15-10(a) 和 
图 题 15-10(b) 确 实 是 全 图 同 构 的 ; 但 图 题 15-10(a) 和 图 题 15-10(c) 并 不 是 全 图 同 构 的 。 

下 面 分 别 给 以 进一步 的 解释 。 由 图 解 15-10 (4) 可 见 , 图 解 15-10(4a) 和 
图 解 15-10(4b) 各 还 保留 了 两 条 虚线 。 在 图 解 15-10(4a) 中 的 两 条 虚线 分 别 对 应 顶点 
和 顶点 之 间 的 连 线 以 及 顶点 @@ 和 顶点 @ 之 间 的 连 线 ,而 图 解 15-10(4b) 中 的 两 条 虚线 
也 分 别 对 应 顶点 @@ 和 顶点 @ 之 间 的 连 线 以 及 顶点 @ 和 顶点 @ 之 间 的 连 线 。 所 以 ,将 两 图 
中 的 这 两 条 连 线 都 考虑 上 ,图 题 15-10(a) 和 图 题 15-10(b) 就 是 全 图 同 构 的 了 。 另 外 ,由 
图 解 15-10(4) 可 见 , 图 解 15-10(4a) 和 图 解 15-10(4c) 也 各 还 保留 了 两 条 虚线 。 但 是 ,图 
解 15-10(4c) 中 的 两 条 虚线 却 分 别 对 应 顶点 下 和 顶点 回 之 间 的 连 线 以 及 顶点 四 和 顶点 四 
之 间 的 连 线 ,与 图 解 15-10(4a) 中 的 两 条 虚线 并 不 对 应 (所 以 并 不 满足 全 图 同 构 的 条 件 ) 。 
类 似 地 ,由 图 解 15-10(4) 可 见 , 图 解 15-10(4b) 和 图 解 15-10(4c) 也 还 各 保留 了 两 条 虚 
线 。 但 是 ,图 解 15-10(4c) 中 的 两 条 虚线 却 分 别 对 应 顶点 中 和 顶点 加 之 间 的 连 线 以 及 项 
点 @ 和 顶点 @ 之 间 的 连 线 ,与 图 解 15-10(4b) 中 的 两 条 虚线 并 不 对 应 (所 以 并 不 满足 全 图 
同 构 的 条 件 ) 。 

















15-11 距离 比较 


气 题 面 ， 
给 定 两 个 有 限 点 集 A={a, as,，…,an} 和 B={b,b:,，…,b,)。 基 本 的 豪 斯 道夫 距离 
(HD) 定 义 为 
Dao (A,B) = max[h(A,B),h(B,A)] = max[max min||a—bl ,maxmin||b—all] 
acA bEB bEB acA 
而 用 平均 值 改进 的 豪 斯 道夫 距离 (MHD) 定 义 为 
Duun A.B)= max[Lhumnap (A,B) ,husp(B,A)] 


1 g 
a > 一 万 ‖ ,= 让 一 
ma m 2EA Be la I n jeB ea | al | 


另外 ,还 有 一 种 距离 (平均 最 小 距离 ,AMD) 定 义 为 ( 设 m 记 nn) 
Damp (A,B)= minLdaw(A,B),daw(B,A)] 


= ml 二 台 Pe | 
m Leh seB Wien EA 


3 个 距离 定义 有 什么 共同 点 ? 有 什么 不 同 点 ? 
i 王 7 下 


所 解析 : 

共同 点 : 

(1) 3 个 距离 定义 都 可 用 来 表征 两 个 点 集 之 间 的 相似 性 。 

(2) 对 相似 性 的 表征 都 基于 为 某 个 点 寻找 最 佳 匹配 。 

(3) 3 个 距离 定义 中 都 可 使 用 不 同 的 范 数 (此 时 的 匹配 区 域 形状 依赖 于 所 用 范 数 ) 。 

(4) 3 个 距离 定义 都 不 受 点 集 之 尺寸 或 分 布 的 限制 。 

不 同 点 : 

(1) Dan 最 终 利 用 的 是 单个 点 与 多 个 点 之 间 的 匹配 ,所 以 对 噪声 和 野 点 都 比较 敏感 ;而 
Duao 和 Dawo 都 利用 了 多 个 点 之 间 匹 配 的 统计 信息 ,所 以 对 噪声 和 野 点 都 较 不 敏感 。 

(2) 从 几何 意义 上 讲 ,Diap 是 要 先 在 每 个 点 集中 都 找到 一 个 点 ,使 另 一 个 点 集 的 所 有 点 
都 落 在 以 该 点 为 中 心 、 以 到 最 远 点 的 距离 为 半径 的 圆 中 ,然后 再 取 两 个 点 集中 最 远 点 距离 大 
的 那个 ; Duno 是 要 先 在 每 个 点 集中 对 每 个 点 都 确定 使 另 一 个 点 集中 的 所 有 点 都 落 在 以 该 点 
为 中 心 以 到 最 远 点 的 距离 为 半径 的 圆 中 ,然后 再 取 两 个 点 集中 所 有 最 远 点 距离 的 平均 值 大 
的 那个 。 所 以 ,Dao 计 算出 来 的 是 单个 极 值 ,所 * 夯 ”出 来 的 圆 是 一 个 实际 包含 男 一 个 点 集中 
的 所 有 点 的 圆 ,而 Duno 计 算出 来 的 是 多 个 极 值 的 平均 值 ,所 * 画 ”出 来 的 圆 不 一 定 能 包含 另 
一 个 点 集中 的 所 有 点 。Daw 的 初始 计算 与 Duao 相 同 ,但 最 后 取 了 两 个 点 集中 所 有 最 远 点 
距离 的 平均 值 小 的 那个 ,以 此 为 半径 * 画 ”出 来 的 圆 表 定 不 能 包含 另 一 个 点 集中 的 所 有 点 。 
如 果 在 Da 的 计算 中 不 利用 统计 平均 ,得 到 的 是 两 个 点 集中 最 近 两 点 之 间 的 距离 (该 距离 
满足 互 换 性 ) ,如 以 此 为 半径 * 画 ”出 来 的 圆 ,会 将 另 一 个 点 集中 的 所 有 点 ( 除 计算 距离 的 那个 
点 外 ) 都 划 在 外 边 。 

(3) 从 数值 上 讲 ,Dan 二 Dwap 过 Daw 。 
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本 单元 包括 3 章 : 

第 16 章 数学 形态 学 

第 17 章 高 层 研 究 应 用 
第 18 章 视 感觉 和 视 知觉 


覆盖 内 容 /范围 简介 

图 像 技术 在 发 展 中 得 到 许多 数学 及 其 他 学 科 理论 和 工具 ,如 机 嚣 学习、 决策 理论 ,模糊 
逻辑 模式 识别 、 人 工 智 能 、 神 经 网 络 、 数 学 形态 学 、 小 波 理 论 、 遗 传 算 法 等 的 支持 。 

数学 形态 学 (也 有 称 图 像 代数 的 ) 是 以 形态 为 基础 对 图 像 进行 分 析 的 数学 工具 。 它 的 基 
本 思想 是 用 具有 一 定形 态 的 结构 元 素 , 去 量度 和 提取 图 像 中 的 对 应 形状 ,以 达到 对 图 像 进行 
分 析 和 识别 的 目的 。 数 学 形态 学 的 应 用 可 以 简化 图 像 数 据 , 保 持 它们 的 基本 形状 特性 ,并 除 
去 不 相干 的 结构 。 数 学 形态 学 的 算法 具有 天 然 的 并 行 实现 的 结构 。 

数学 形态 学 的 操作 对 象 可 以 是 二 值 图 像 也 可 以 是 灰 度 图 像 。 数 学 形态 学 的 基本 运算 在 
二 值 图 像 中 和 灰 度 (多 值 ) 图 像 中 各 有 特点 ,基于 这 些 基 本 运算 而 推导 出 的 组 合 运 算 和 结合 
构成 的 实用 算法 也 不 相同 。 

对 图 像 技术 的 研究 和 应 用 在 不 断 发 展 中 ,近年 来 的 一 个 趋势 是 逐渐 向 高 层 技术 倾斜。 
例如 ,有 关 多 传感器 图 像 信息 融合 和 逮 感 图 像 的 应 用 得 到 了 广泛 的 关注 。 这 是 因为 使 用 多 
传感器 系统 和 多 信息 融合 技术 可 以 提高 容错 功能 、 提 高 测量 精度 、 提 高 信息 加 工 速度 、 提 高 
信息 的 利用 效率 ,并 降低 信息 获取 的 成 本 。 又 如 ,基于 内 容 的 图 像 和 视频 检索 成 为 进入 信息 
化 社会 、 各 种 类 型 的 视觉 信息 在 全 球 得 到 广泛 采集 、 传 输 和 应 用 背景 下 信息 技术 的 一 个 新 的 
重要 研究 领域 。 从 语义 层次 分 析 , 相 关 工作 在 这 些 年 经 历 了 一 个 从 视觉 感知 层 开始 ,进而 进 


入 目标 层 和 场景 层 , 并 到 达 抽象 的 主观 语义 层 。 再 如 , 随 着 时 空 技术 和 设备 的 发 展 , 已 能 实 
现 对 场景 中 各 种 目标 在 时 间 和 空间 上 的 全 面 检测 和 跟踪 。 在 充分 掌握 场景 时 空 信息 的 基础 
上 ,借助 知识 进行 推理 .判断 ,分 析 场 景 含义 ,解释 场景 动态 的 研究 也 正在 广泛 展开 。 

图 像 理解 可 以 看 作 是 利用 计算 机 来 实现 人 类 的 视觉 功能 ,以 达到 对 客观 世界 中 时 空 场 
景 的 感知 识别 和 解释 。 视 觉 包括 视 感 觉 和 视 知 觉 ,图 像 理解 基于 视 感 觉 ,但 与 视 知觉 有 更 
多 的 相关 之 处 。 视 知觉 又 可 分 为 亮度 知觉 .彩色 知觉 .形状 知觉 .空间 知觉 和 运动 知觉 等 。 
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数学 形态 学 是 以 形态 学 为 基础 对 图 像 进行 分 析 的 数学 工具 。 它 采用 具有 一 定形 态 的 结 
构 元 素 , 去 量度 和 提取 图 像 中 的 对 应 形状 ,实现 对 图 像 的 特定 操作 。 

数学 形态 学 的 基本 运算 主要 是 膨胀 (或 扩张 )、 腐 蚀 ( 或 侵蚀 )、 开 启 和 闭合 ,有 些 研究 者 
也 将 击 中 一 击 不 中 变换 看 作 基本 运算 。 以 这 些 基 本 运算 为 基础 ,可 推导 出 各 种 数学 形态 学 
的 组 合 运算 ,进一步 还 可 构成 各 种 完成 图 像 加 工 的 实用 算法 。 

数学 形态 学 的 操作 对 象 可 以 是 二 值 图 像 也 可 以 是 灰 度 (彩色 ) 图 像 , 常 分 别称 为 二 值 数 








学 形态 学 和 灰 度 数学 形态 学 。 数 学 形态 学 的 基本 运算 在 二 值 图 像 中 和 灰 度 (多 值 ) 图 像 中 各 
有 特点 ,基于 这 些 基 本 运算 而 推导 出 的 组 合 运算 和 结合 构成 的 实用 算法 也 不 相同 。 

另 一 方面 ,也 有 人 将 数学 形态 学 推广 到 更 一 般 的 概念 一 一 图 像 代 数 。 图 像 代 数 可 将 各 
种 数学 形态 学 操作 内 在 其 中 ,而 且 还 比 形态 学 包含 了 更 多 的 操作 。 

本 童 的 问题 涉及 上 述 数 学 形态 学 多 个 方面 的 概念 。 


16-1 膨胀 的 计算 


有 J 题 面 : 

给 定 一 个 二 值 图 像 集 合 A, 如 图 题 16-1(a) 中 阴影 部 分 所 示 。 图 题 16-1(b)、 图 
题 16-1(c) 和 图 题 16-1(d) 为 3 个 结构 元 素 (“ 十 "代表 原点 )。 给 出 分 别 用 这 3 个 结构 元 素 去 
膨胀 A 的 结果 。 
































国 团 轩 


(a) (b) (人 9) (9d) 
图 题 16-1 图 像 和 结构 元 素 


忌 解 析 : 
膨胀 计算 的 结果 依次 如 图 解 16-1(a) 图解 16-1(b) 和 图 解 16-1(c) 所 示 ,其 中 深 色 区 域 


表示 膨胀 后 增加 的 部 分 。 
加 (b) © 


图 解 16-1 膨胀 结果 

















16-2 ” 灰 度 膨胀 的 组 合 性 











各 题 面 : 
给 定 如 下 灰 度 图 像 了 以 及 两 个 结构 元 素 和 < ,借助 它们 验证 灰 度 膨胀 的 组 合 性 。 
人 | 
入 和 各 各 性 0 0 0 0 工 中 
站 二 | 本 区 本 测 扣 | 功 二 | 了 下 | 
(i) 0 0 0 全 和 从 
(1 
各 解析 : 
需要 验证 : (f 旬 bp)8c 二 f(b 昌 c)。 对 等 号 两 边 分 别 计算 。 
一 方面 , 先 组 合 结构 元 素 再 膨胀 : 











0 0 © :BE 闻 和 人 
so- 1 el 1 ol-|e so 
人 0. WW 必 | 1 工 攻 交集 沁 
O00 B 站 站 办 这 
0 时 有 玫 沁 05660 
了 田 (0 四 co)=|o02 3 14 "| 2 中 0 Gn 0 
人 条 本 机 有 人 串 上 和 仑 歼 06770 
0 oO 0 Uo 0 
另 一 方面 ,依次 膨胀 : 
0 0 0 Q 本 /有 9 直 
人 入 到 区 辣 才 站 可 克 国人 1 
(SONOe=1l0 2 3 4 "| 1 | 1 路 E77 人 0 
人 全 和 建 大 兴 0 0 0 Lo0 1 
人 人 有 办 由 000 0 0 


两 种 结果 相同 , 灰 度 膨胀 的 组 合 性 得 到 验证 。 


16-3 ”腐蚀 的 组 合 性 


如题 面 : 

给 定 一 个 二 值 图 像 集 合 A, 如 图 题 16-3(a) 中 阴影 部 分 所 示 。 图 题 16-3(b) 和 图 题 16-3(c) 
为 两 个 结构 元 素 B 和 CC* 十 ”代表 原点 )。 如 果 先 用 一 个 结构 元 素 腐蚀 A, 再 将 腐蚀 结果 用 另 一 个 
结构 元 素 腐蚀 ,最 终 会 得 到 什么 样 的 集合 ?如 果 利 用 腐蚀 的 组 合 性 会 有 什么 结果 ? 

气 解 析 : 

根据 腐蚀 的 组 合 性 : (4AGB)GC=AG(B 申 C) ,可 先 用 一 个 结构 元 素 去 膨胀 另 一 个 结 
构 元 素 , 得 到 如 图 解 16-3(a) 所 示 的 结构 元 素 , 再 用 它 去 腐蚀 集合 A ,得 到 如 图 解 16-3(b) 所 
示 的 最 终结 果 ( 深 色 区 域 ) 。 这 与 依次 使 用 两 个 结构 元 素 去 腐蚀 结果 相同 。 

.176 ，。 















































中 中 加 


(a) (a) 


16-4 ”位 移 不 变性 验证 


名 题 面 : 























(b) 
图 题 16-3 ”图 像 和 结构 元 素 图 解 16-3 ”新 结构 元 素 和 腐蚀 结果 


用 矢量 运算 方法 借助 图 题 16-4(a) 和 图 题 16-4(b) 给 出 的 二 值 图 像 集 合 A 以 及 结构 元 


素 B 验证 膨胀 ,腐蚀 和 开启 3 种 运算 的 位 移 不 变性 ,其 中 设 图 像 


集合 A 的 左上 角 像 素 位 置 为 (0, 0) ,位 移 取 x=(1, 2)。 
要 解析 : 
根据 题 意 ,需要 验证 : 
(1) (A),® B=(A © B). 
(2) (A).G B=(A © B)。 
(3) A°(B),.=A°B 
下 面 分 别 验证 ， 






































图 


(a) (b) 
图 题 16-4 图像 和 结构 元 素 


(1) A= {(1, 1), (2, 1), (2, 2), (2, 4), (3, 2), (3, 3), (3, 4), 


(3, 5), (4, 2), (4, 4), (4, 5), (5, 4)} 
B= {(0,0), (0,—1), (1, 0)} 


(A):= {(2, 3), (3, 3), (3, 4), (3, 6), (4, 4), (4, 5), (4, 6), 


(4, 7), (5, 4), (5, 6), (5, 7), (6, 6)} 


(CA) 四 B= {(2, 3), (3, 3), (3, 4), (3, 6), (4, 4), (4, 5), 
(4, 6), (4, 7), (5, 4), (5, 6), (5, 7), (6, 6),(2, 2), (3, 2), 
(3, 3),(3, 5), (4, 3), (4, 4), (4, 5), (4, 6), (5, 3), (5, 5), 
(5, 6), (6, 5),(3, 3), (4, 3), (4, 4), (4, 6), (5, 4), (5, 5), 
(5, 6), (5, 7), (6, 4), (6, 6), (6, 7), (7, 6)} 
= {(2, 2), (2, 3), (3, 2), (3, 3), (3, 4), (3, 5), (3, 6), 
(4, 3), (4, 4), (4, 5), (4, 6), (4, 7),(5, 3), (5, 4)，» 
(5, 5), (5, 6), (5, 7),(6, 4), (6, 5), (6, 6), (6, 7), (7, 6)} 
A®BB= UI, DD, DD, CC, ,DG, 2 GG, ,8, ,3 0, 

(4, 2), (4, 4), (4, 5), (5, 4),(1, 0), (2, 0), (2, 1), (2, 3), 
(3, 1), (3, 2), (3, 3), (3, 4), (4, 1), (4, 3), (4, 4), (5, 3), 
(2,1), (3, 1), (3, 2), (3, 4), (4, 2), (4, 3), (4, 4), (4, 5), 


(53 2)s (55 D3 (Hs 05 C65 4 


> 二 7 和 


= 
ta 1D 03; 2) (985 Ds. (35 Ws (3 
= D3 Ws > Ws ds Ws 
Wr BW 2 DW EW 
(4 = 
全 
0 
可 见 ,(A),® B=(A 四 了 B)。 
(2) (AQOB)= {2,2), (3,4), (3,5)}=>(AQ EB), 
= WD 
(A): © B= 1{(3,4), (4, 6), (4, 7)} 
可 见 ,(A), B=(A © B)。。 
(3) 
发 = 
WS Dr 
(B= 
AQ (B= {(1, 0), (2, 2), (2, 3)} 
A B= WD 0 DD sD i 
二 
kds D5 ds WY 
可 见 ,A*(B), 二 A*B。 


16-5 ”结构 元 素 的 尺寸 和 取 值 


扣 题 面 : 

设计 结构 元 素 ,对 Lena 图 像 进 行 灰 度 闭合 操作 实验 : 

(1) 看 看 结构 元 素 的 尺寸 对 图 像 会 产生 什么 影响 ? 

(2) 看 看 结构 元 素 的 取 值 对 图 像 会 产生 什么 影响 ? 

扣 解 析 : 

(1) 设计 了 3 个 尺寸 不 同 的 十 字 交 叉 状 的 结构 元 素 如 下 : 


1 

4 

| 4 7 
B=|3 5 7| B=|3 5 9 11| B=|3 57 9 11 13 15 

9 10 11 

13 14 


各 训 


用 这 3 个 结构 元 素 进行 灰 度 闭合 操作 得 到 的 结果 如 图 解 16-5(1) 所 示 。 可 见 , 随 着 结 
构 元 素 的 尺寸 增加 ,图 像 的 整体 亮度 有 所 增加 ,但 细节 模糊 得 更 多 。 例 如 ,头发 变 得 越 来 越 
不 清晰 。 





图 解 16-5(1) 用 3 个 不 同 尺寸 的 结构 元 素 进行 灰 度 闭合 操作 得 到 的 结果 


(2) 设计 了 3 个 尺寸 相同 但 取 值 不 同 的 十 字 交 叉 状 的 结构 元 素 如 下 
20 10 
20 1 20 -| 让 各 0 " 
i 20 10 
用 这 3 个 结构 元 素 进行 灰 度 闭合 操作 得 到 的 结果 如 图 解 16-5(2) 所 示 。 可 见 ,前 两 个 
结果 比 第 三 个 结果 整体 要 亮 些 ,因为 结构 元 素 中 有 较 大 值 的 系数 。 对 比 第 一 个 结果 和 第 二 
个 结果 的 嘴巴 处 ,第 一 个 结果 的 嘴巴 比较 清晰 。 这 是 因为 嘴巴 基本 上 是 个 横向 结构 ,第 二 个 
结构 元 素 沿 垂直 方向 取 值 较 大 ,会 导致 垂直 方向 上 的 模糊 。 


B= 

















图 解 16-5(2) 用 3 个 不 同 取 值 的 结构 元 素 进行 灰 度 闭合 操作 得 到 的 结果 


16-6 ”结构 元 素 分 解 


各 题 面 : 
将 结构 元 素 分 解 可 减少 操作 时 间 。 试 证 明 可 将 一 个 有 13 个 非 零 元 素 的 5X5 圆柱 模板 
分 解 成 两 个 各 有 5 个 非 零 元 素 的 3X3 圆柱 模板 ,如 图 题 16-6 所 示 。 














中 
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图 题 16-6 ”模板 的 分 解 
。179 。 


名 解析 1: 


将 一 个 3X3 模板 加 两 圈 0 进行 扩展 ,看 作 f, 将 另 一 个 3X3 模板 看 作 5, 对 f 进行 脱 
胀 。f 如 图 解 16-6(1a) 所 示 , 只 需 考 虑 用 6b 的 原点 与 中心 5X5 的 区 域 重合 进行 膨胀 。 有 
两 种 情况 : 如 果 65 的 原点 与 了 中 心 3X3 的 区 域 重 合 ,膨胀 的 结果 都 是 2, 如 图 解 16-6(1b) 











所 示 ; 如 果 b 的 原 





点 与 了 中心 3X3 的 区 域 之 外 的 4 条 边 重 合 , 则 膨胀 的 结果 除 在 每 条 边 的 


中 点 为 2 外 其 余 点 都 为 0, 如 图 解 16-6(1c) 所 示 。 将 图 解 16-6(1b) 和 图 解 16-6(1c) 结 合 起 


来 就 得 到 所 需 结 果 如 图 解 16-6(1d) 所 示 。 






























































(b) 
图 解 16-6(1) ”用 膨胀 验证 模板 的 分 解 
名 解析 2: 





直接 计算 两 个 模板 互相 有 重要 的 情况 。 考 虑 到 对 称 性 ,只 列 出 6 种 重生 情况 如 


图 解 16-6(2) 第 一 行 ,而 对 应 的 膨胀 结果 如 第 二 行 所 示 。 


































































































图 解 16-6(2) 分 重 倒 情况 膨胀 验证 模板 的 分 解 


将 所 有 结果 (包括 对 称 的 结果 ) 都 组 合 起 来 ,就 可 得 到 有 13 个 非 零 元 素 的 5X5 
模板 。 





16-7 开启 .闭合 .高 帽 运算 


如题 面 : 
给 定 如 下 灰 度 图 像 f 以 及 结构 元 素 b ,计算 用 b 对 了 的 开启 .闭合 、 高 帆 变 换 。 


~ 80!® 








圆柱 


让 让 1 
f=|I0 002340 0| b=|2 4 2 
[0 i 











各 解析 : 
设 开 启 .闭合 .高 帽 变换 的 结果 分 别 为 wu、v、w: 
LE 1 
本 ,天 ,本 ,本 000010 0 
人 有 工 0 0 古人 
是 三 | 站 人 省 0 0 过 三 | 闪 0 时 浊 有 攻 兴 
0 和 2 0 0 | 
0 0 0 00 0 1 
站 站 大 
O00 00 0 0 
vw ov ow 
00%0%0100 
w 0 
1 
0 和 区 
0 
16-8 ”形态 学 基本 操作 
各 题 面 : 


给 定 如 图 题 16-8 所 示 的 图 像 , 对 它 进行 形态 学 基本 
操作 (膨胀 、 腐 包 、 开 启 、 闭 合 ) 以 及 组 合 操 作 , 给 出 实验 

各 解析 : 

实验 结果 如 图 解 16-8 所 示 , 其 中 图 解 16-8(a) 为 膨 
胀 的 结果 ,图 解 16-8(b) 为 腐蚀 的 结果 ,图 解 16-8(c) 为 
开启 的 结果 .图解 16-8(d) 为 闭合 的 结果 ,图 解 16-8(e) 为 
先 开启 后 闭合 的 结果 ,图 解 16-8(f) 为 先 闭合 后 开启 的 
结果 。 图 题 16-8 ”实验 图 像 
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(a) (b) 








图 解 16-8 ”形态 学 基本 操作 结果 


16-9 ” 击 中 一 击 不 中 计算 





各 题 面 : 
用 下 面 给 定 的 二 值 图 像 集合 A 以 及 两 个 击 中 一 击 不 中 结构 元 素 E 和 下 进行 击 中 一 击 
不 中 变换 . 
El 
LL 0 1 0 
PE E=|1 0 1 
El 0 1 生 六 
‘| 
各 解 析 : 
根据 击 中 一 击 不 中 变换 式 
交 介 (EF)》 = 
依次 计算 
0 0 0 0 0 0 0 0 0 0 
0 0 0 0 0 1 0 0 0 0 
ASE=|I0 O00 0 0 OF=I0 0 
0, 0 0 
1 1 3 和 ,| 
最 后 结果 为 


.182 。 











0 
(UR 
ANff(E,F)= (AQOE)N (AORF) 000000 90 
站 
0 小 


16-10 不 同 距离 圆 盘 的 细 化 


各 题 面 : 

合成 一 幅 二 值 图 像 , 其 中 有 一 个 半径 为 > 的 圆 盘 。 现 要 将 它 细 化 成 半径 为 > 一 1 的 
圆 盘 。 

(1) 如 果 要 细 化 城区 距离 圆 盘 , 应 使 用 什么 样 的 结构 元 素 ? 

(2) 如 果 要 细 化 棋盘 距离 圆 盘 , 应 使 用 什么 样 的 结构 元 素 ? 

(3) 如 果 要 细 化 的 是 取 整 的 欧 氏 距离 圆 盘 , 设 ”一 4, 分 别 给 出 连续 使 用 (1) 或 (2) 中 的 结 
构 元 素 而 得 到 的 半径 递减 的 圆 盘 系 列 。 

各 解析 : 

(1) 可 使 用 如 图 解 16-10(1) 所 示 的 一 组 模板 (结构 元 素 ) ,它们 将 依次 细 化 掉 圆 盘 上 、 
左 \ 下 , 布 方 向 的 最 外 层 像 素 。 


国力 
图 解 16-10(1) 用 于 细 化 城区 距离 圆 盘 的 模板 


(2) 可 使 用 如 图 解 16-10(2) 所 示 的 一 组 模板 (结构 元 素 ) ,它们 将 依次 细 化 掉 圆 盘 右 
上 左上 左下 \ 右 下 方向 的 最 外 层 像素 。 


图 解 16-10(2) 用 于 细 化 棋盘 距离 圆 盘 的 模板 
(3) 使 用 图 解 16-10(1) 的 模板 得 到 的 圆 盘 系 列 依次 如 图 解 16-10(3) 所 示 。 














































































































图 解 16-10(3) 用 城区 距离 模板 细 化 得 到 的 圆 盘 系列 


使 用 图 解 16-10(2) 中 的 模板 得 到 的 圆 盘 系 列 依次 如 图 解 16-10(4) 所 示 。 
可 见 使 用 棋盘 距离 模板 的 细 化 速度 要 大 于 使 用 城区 距离 模板 的 细 化 速度 。 
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图 解 16-10(4) 用 棋盘 距离 模板 细 化 得 到 的 圆 盘 系 列 


16-11 圆 盘 细 化 实例 


名 题 面 : 

用 计算 机 生成 一 幅 中 心 有 一 个 圆 形 目标 的 二 值 图 像 , 利 用 像素 的 4- 邻 域 作为 模板 来 细 
化 圆 盘 ,给 出 所 得 到 的 圆 盘 系列 。 

气 解 析 : 

设 圆 盘 半 径 为 7 个 像素 (借助 取 整 的 欧 氏 距离 计算 ), 所 得 到 的 细 化 系列 如 图 解 16-11 
所 示 。 可 见 , 圆 盘 逐 渐 演 变 成 正方 形 , 最 后 成 为 单个 像素 。 


图 解 16-11 ”实验 得 到 的 细 化 圆 盘 系列 
16-12 细 化 步骤 和 过 程 





如题 面 


如 图 题 16-12 所 示 为 一 个 二 值 图 像 集合 和 一 对 结 “ti 
构 元 素 (分 别 为 击 中 结构 元 素 和 击 不 中 结构 元 素 ) ,给 出 
仅 用 这 两 个 结构 元 素 对 图 像 集合 细 化 中 各 个 步骤 的 团 
be 


二 图 题 16-12 图 像 集合 和 结构 元 素 




































































要 解析 : 

第 一 次 细 化 中 各 个 步骤 的 结果 如 图 解 16-12(1) 所 示 ,其 中 图 解 16-12(1a) 为 击 中 结 
图 解 16-12(1b) 为 击 不 中 结果 ,图 解 16-12(1c) 为 取 交 集 而 得 到 的 击 中 一 击 不 中 变 eer 
图 解 16-12(1d) 为 从 图 像 中 减 去 击 中 - 击 不 中 变换 结果 而 得 到 的 第 一 次 细 化 结果 。 

第 二 次 细 化 对 图 解 16-12(1d) 进行 ,各 个 步骤 的 结果 如 图 解 16-12(2) 所 示 , 其 中 
.184 。 




















































































































(a) (b) (9 

















(d) 


图 解 16-12(1) 第 一 次 细 化 中 各 个 步骤 的 结果 


图 解 16-12(2a) 为 击 中 结果 ,图 解 16-12(2b) 为 击 不 中 结果 ,图 解 16-12(2c) 为 取 交 集 而 得 
到 的 击 中 一 击 不 中 变换 结果 ,图 解 16-12(2d) 为 从 图 像 中 减 去 击 中 一 击 不 中 变换 结果 而 得 


到 的 第 二 次 细 化 结果 。 








































































































(b) (0 











(d) 


图 解 16-12(2) 第 二 次 细 化 中 各 个 步骤 的 结果 


第 三 次 细 化 对 图 解 16-12(2d) 进行 ,各 个 步骤 的 结果 如 图 解 16-12(3) 所 示 , 其 中 
图 解 16-12(3a) 为 击 中 结果 ,图 解 16-12(3b) 为 击 不 中 结果 ,图 解 16-12(3c) 为 取 交 集 而 得 
到 的 击 中 一 击 不 中 变换 结果 ,图 解 16-12(3d) 为 从 图 像 中 减 去 击 中 一 击 不 中 变换 结果 而 得 


到 的 第 三 次 细 化 结果 。 





































































































(a) (b) (9) 











(d) 


图 解 16-12(3) 第 三 次 细 化 中 各 个 步骤 的 结果 
第 三 次 细 化 之 后 ,如 果 再 继续 细 化 结果 不 会 变化 ,所 以 细 化 完毕 。 


16-13 粗 化 步骤 和 过 程 


如 题 面 : 

如 图 题 16-13 所 示 为 一 个 二 值 图 像 集合 和 一 对 结构 
元 素 ( 分 别 为 击 中 结构 元 素 和 击 不 中 结构 元 素 ), 给 出 仅 
用 这 对 结构 元 素 对 图 像 集合 粗 化 中 各 个 步骤 的 结果 。 

所 解析 : 

先 对 图 像 集合 进行 求 补 , 再 对 求 补 结果 进行 第 一 次 
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| 加 











细 化 。 这 里 各 个 步骤 的 结果 如 图 解 16-13(1) 所 示 , 其 中 图 是 1613 图 像 集合 和 结构 元 素 
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图 解 16-13(1a) 为 求 补 结果 ,图解 16-13(1b) 为 击 中 结果 ,图 解 16-13(1c) 为 击 不 中 结果 ,图 
16-13(1d) 为 取 交 集 而 得 到 的 击 中 - 击 不 中 变换 结果 ,图 解 16-13(1e) 为 从 图 像 中 减 去 击 
中 - 击 不 中 变换 结果 而 得 到 的 第 一 次 细 化 结果 。 









































































































































(a) (b) (9) (d) (e) 
图 解 16-13(1) 求 补 和 第 一 次 细 化 中 各 个 步骤 的 结果 


第 二 次 细 化 对 图 解 16-13(1e) 进 行 ,各 个 步骤 的 结果 如 图 解 16-13(2) 所 示 , 其 中 图 
解 16-13(2a) 为 击 中 结果 ,图 解 16-13(2b) 为 击 不 中 结果 ,图 解 16-13(2c) 为 取 交 集 而 得 到 的 
击 中 一 击 不 中 变换 结果 ,图 解 16-13(2d) 为 从 图 解 16-13(1e) 中 减 去 击 中 一 击 不 中 变换 结果 
而 得 到 的 第 二 次 细 化 结果 。 




























































































(a) (b) (9) (d) 
图 解 16-13(2) 第 二 次 细 化 中 各 个 步骤 的 结果 


第 三 次 细 化 对 图 解 16-13(2d) 进 行 ,各 个 步骤 的 结果 如 图 解 16-13(3) 所 示 , 其 中 
图 解 16-13(3a) 为 击 中 结果 ,图 解 16-13(3b) 为 击 不 中 结果 ,图 解 16-13(3c) 为 取 交 集 而 得 到 的 
击 中 一 击 不 中 变换 结果 。 因 为 击 中 一 击 不 中 变换 结果 为 空 集 ,所 以 细 化 结束 。 图 解 16-13 
(3d) 为 从 图 像 中 减 去 击 中 一 击 不 中 变换 结果 而 得 到 的 第 三 次 细 化 结果 ,与 图 解 16-13(d) 相 同 。 
此 时 对 图 解 16-13(3d) 再 求 补 ,就 可 以 得 到 如 图 解 16-13(3e) 所 示 的 粗 化 结果 。 





























































































































(a) (b) 
图 解 16-13(3) 第 三 次 细 化 中 各 个 步骤 及 求 补 的 结果 


16-14 利用 粗 化 进行 细 化 


名 题 面 : 
如 图 题 16-14 所 示 为 一 个 二 值 图 像 集合 和 一 组 结构 元 素 , 给 出 借助 这 组 结构 元 素 通 过 
使 用 粗 化 操作 来 实现 对 图 像 集合 细 化 中 各 个 步骤 的 结果 。 
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图 题 16-14 图像 集合 和 结构 元 素 














气 解析 : 
先 对 原 图 求 补 ,然后 依次 用 8 个 结构 元 素 对 补 集 各 进行 一 次 细 化 , 结 


[EE 嘲 
ss 


图 解 16-14(1) 求 补 和 第 一 轮 细 化 结果 
如 此 循环 细 化 ,直到 不 再 有 变化 ,得 到 图 解 16-14(2a)。 对 该 结果 再 求 补 , 就 得 到 用 粗 
化 操作 实现 对 图 像 集合 细 化 的 最 终结 果 , 如 图 解 16-14(2b) 所 示 。 





































































































































































































(b) 


(a) 
图 解 16-14(2) 循环 细 化 和 最 终 细 化 结果 


16-15 噪声 滤 除 


气 题 面 : 
选 一 幅 受 到 椒盐 噪声 污染 的 二 值 图 像 ,结合 开启 和 闭合 操作 进行 噪声 消除 。 
艺 解 析 ， 


所 选 的 实验 图 像 如 图 解 16-15(a) 所 示 ( 指 纹 图 像 ) ,利用 对 图 像 先 开启 再 闭合 滤 除 噪声 
的 结果 如 图 解 16-15(b) 和 图 解 16-15(c) 所 示 。 其 中 ,图 解 16-15(b) 为 使 用 4- 连接 结 构 元 
素 得 到 的 结果 ,而 图 解 16-15(c) 为 使 用 8- 连 接 结构 元 素 得 到 的 结果 。 


C2、 A 


\ 
(a) (b) 


图 解 16-15 ”实验 图 像 和 实验 结果 
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气 题 面 : 

计算 Lena 图 像 的 4 个 形态 学 梯度 (4 为 了 的 邻 域 平均 ): 
gradi = (f ®@)—(fOb) 
grad,, = (f Db)—Jf, gradz = f—(fOb) 
grads = min{[(f BW)—f], [f—(fO0o))} 
grads min{[(h OD—AhJ], [hm(hOb))) 








如 解析 : 
-组 计算 得 到 的 4 个 形态 学 梯度 图 依次 如 图 解 16-16(1) 所 示 。 相 对 来 说 ,4 个 形态 学 
梯度 的 边缘 强度 逐步 减弱 (边缘 宽度 也 逐步 减少 )。 事 实 上 ,grad 是 两 个 grads 的 和 ,grads 
取 两 个 grad, 中 小 的 那个 ,grad, 是 平滑 后 再 按 grad; 计算 出 来 的 。 





图 解 16-16(1) 4 个 形态 学 梯度 图 


两 个 grads 的 结果 略 有 不 同 。 其 中 一 个 将 区 域 轮廓 算 在 区 域内 , 另 一 个 将 区 域 轮廓 算 
ed ,但 它们 在 图 像 尺寸 较 大 时 很 难看 出 区 别 。 不 过 ,这 个 小 的 细节 区 别 在 Lena 图 中 
帽子 上 的 装饰 部 分 还 是 体现 得 比较 明显 的 ,如 图 解 16-16(2) 的 两 个 局 部 图 所 示 , 它 们 分 别 
是 用 两 个 grad; 计算 出 来 的 。 





图 解 16-16(2) 两 个 grad; 局 部 图 


16-17 形态 学 梯度 边缘 增强 算 子 


各 题 面 : 

-个 基于 二 值 形态 学 梯度 的 边缘 增强 算 子 定义 为 G==(AB) 一 (AGB) 。 

(1) 使 用 一 个 线段 边缘 模型 ,说 明 G 算 子 将 在 二 值 图 像 中 给 出 一 个 更 宽 的 边缘 ; 
.188 ， 


























































































































(2) 如 果 忽 略 朝向 ( 仅 考虑 幅度 ) ,说 明 G 算 子 的 效果 类 似 于 用 索 贝 尔 算 子 增强 边缘 ; 

(3) 选 一 幅 图 像 ,先进 行 边 缘 检 测 ,再 使 用 G 算 子 ,验证 上 面 的 观点 。 

名 解析 : 

(1) 所 生成 的 含有 一 个 线段 边缘 的 二 值 图 如 图 解 16-17(1a) 所 示 , 对 它 进行 膨胀 和 腐蚀 
操作 (假设 使 用 4- 邻 域 形式 的 结构 元 素 ) 的 结果 分 别 见 图 解 16-17(1b) 和 图 解 16-17(1c) ,使 
用 G 算 子 给 出 的 结果 见 图 解 16-17(1d) ,可 见 原 有 边缘 得 到 了 加 宽 。 

(a) (b) (©) (d) 
图 解 16-17(1) G 算 子 加 宽 边 缘 

(2) 使 用 与 图 解 16-17(1a) 相 同 的 含有 一 个 线段 边缘 的 二 值 图 ( 见 图 解 16-17(2a)), 计 
算 水 平 梯度 平方 G: 如 图 解 16-17(2b) 所 示 ,计算 垂直 梯度 平方 G: 如 图 解 16-17(2c) 所 示 ， 
所 以 使 用 索 贝 尔 算 子 的 结果 如 图 解 16-17(2d) 所 示 ,与 G 算 子 的 效果 类 似 。 



































(a) 





(3) 选择 





名 题 面 : 


.ena 图 像 , 先 























(b) 


图 解 16-17(2) 





(a) 


图 解 16-17(3) 


16-18 


取 阅 值 转化 为 二 值 图 
检测 得 到 图 解 16-17(3b); 再 使 用 G 算 子 得 到 图 








(©) 
索 贝尔 边缘 增强 算 子 加 宽 边 缘 

















(b) 


边缘 加 宽 的 实例 


8- 连 接 转 m- 连 接 




















(d) 


像 ,如 图 解 16-17(3a) 所 示 ; 进行 普通 边缘 


(9) 


给 定 一 个 单 像素 宽 且 完全 8- 连 接 的 二 值 边界 , 现 要 设计 一 个 形态 学 算法 将 其 转化 为 m- 


连接 的 二 值 边界 。 
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气 解析 : 

在 单 像素 宽 且 完全 8- 连 接 的 二 值 边界 中 ,多 连接 或 歧义 连接 的 问题 具有 如 图 解 16-18 
所 示 的 4 种 基本 模式 (其 中 1 代表 边界 点 ,0 代表 非 边界 点 , 关 代 表 都 可 以 )。 可 以 使 用 击 
中 一 击 不 中 变换 来 检测 这 些 模式 ,然后 将 中 心 像素 转换 为 0。 


























of 1[x| [xfTofo ofx 
1|1lol lililo 1|1 
xlolol [ol ilx| xl 














图 解 16-18 ”歧义 连接 的 模式 (也 用 作 结 构 元 素 ) 


设 图 像 集合 为 A, 选 择 如 图 解 16-17 所 示 的 4 种 基本 模式 为 4 个 结构 元 素 Bi 、B,、B;、 
Bi( 其 中 1 对 应 击 中 而 0 对 应 击 不 中 , X 代表 无 须 确定 ) ,完成 转换 工作 的 形态 学 操作 序 
列 是 : 
= 二 = 人 六 
(= 
(= 
(4) X,=Y;s 介 B,,Y,=YsNN Xs 


16-19 ” 顶 面 和 阴影 





气 题 面 ， 

为 把 数学 形态 学 的 运算 规则 从 二 值 图 像 推广 到 灰 度 图 像 ,引入 了 集合 的 项 面 (T) 和 阴 
影 (U) 的 概念 。 如 用 了 表示 灰 度 图 ,用 5 表示 灰 度 结构 元 素 . 则 用 5b 对 了 的 膨胀 .腐蚀 分 别 
定义 为 : 

f@45= T{U(f) DUOD))} 
fAQb= TIU(f) OU(COD)) 
另 一 方面 ,根据 函数 排序 的 思路 ,也 可 将 膨胀 .腐蚀 分 别 定 义 为 (为 简便 ,考虑 1-D): 
(fFfOD (0) = max(f(— z+b2) | 人 一 动人 DesiiE D,} 
(Ff OD (=mn{(f(sr ta —Nz) | Ga) E Disz ED) 
式 中 ,Dr 和 DD, 分 别 是 了 和 bw 的 定义 域 。 

试 证 明 它们 分 别 对 应 等 价 。 

所 解析 : 

先 考虑 灰 度 膨胀 。 由 集合 阴影 的 定义 : 

U(CP) = ([Lzyx(z)]|zEDr0 委 xz) < max(f)} 
U(b) = {[x,v (xz) | x € D;,,0 < v(x) < max(b)} 
对 它们 进行 膨胀 操作 
EC 四 可 ( 态 王 人 6G 一 二 十 起 克 ] | (5 ~) EE Dy, 
站 和 区 Das 一 区 十 az 二 机 Los 一 十 Ex 

再 考虑 集合 顶 面 的 定义 : 

TLUCP) BU = 一 ([Ls,xGs 一 z) 十 oCz)] | (s—z) EDr， 








~ 90' 二 


ZED,ucs 一 z) 十 uCz) 一 max[LFGs 一 z) 十 DCz)]) 
将 条 件 中 的 等 式 蔡 换 条 件 前 的 部 分 ,得 到 : 
TLU(CP 四 U(D)] = {max[LFGs 一 z) 十 bz)] | (s—z) EDr，zED)=(F 四 0() 
再 考虑 灰 度 腐蚀 。 由 集合 阴影 的 定义 和 腐蚀 操作 ,类似 得 到 : 
U(f) OUD) ={[Lssulsi+ 7x) — v(x)] | 十 四 EDr 
rED,,O0Zulst+7r) — vr) 入 min[FGs 十 z) 一 5Cz)]} 
最 后 考虑 集合 项 面 的 定义 ,并 进行 类 似 替换 ,得 到 : 
T[U(f) 日 U(CO)]= {Lsyuls+7z)—v(z)] | (+x) ED,, 
x ED,sulst+7z)—vr) 一 min[LFGs 十 z) 一 0Cz)]} 
{(minLFGs 十 z) 一 bz)] | (十 zeEDr，zED)=(FG 昌 DG) 








» 浊 9 下 全 





在 图 像 工 程 的 框架 中 ,处 在 高 层 的 是 图 像 理解 。 近 年 来 有 一 些 与 图 像 理解 相关 的 研究 
应 用 领域 得 到 了 较 多 的 关注 。 例 如 ,多 传感器 图 像 信息 融合 .基于 内 容 的 视觉 信息 检索 、 时 
空 行为 理解 以 及 更 一 般 的 视觉 场景 理解 等 。 在 这 些 领 域 ,基础 仍然 是 图 像 处 理 和 图 像 分 析 ， 
但 最 终 的 目标 都 是 要 通过 对 图 像 的 理解 实现 对 场景 的 解释 。 

多 传感器 信息 融合 是 将 来 自 多 个 传感器 的 信息 数据 进行 综合 加 工 ,获得 比 仅 使 用 单个 
传感器 信息 数据 更 全 面 、 准 确 、 可 靠 的 结果 的 信息 技术 和 过 程 。 现 在 使 用 不 同 传感器 获得 的 
图 像 种 类 很 多 ,如 红外 图 像 、 多 光谱 图 像 高 光谱 图 像 .毫米 波 雷 达 图 像 计算 机 断层 图 像 、 康 
普 顿 背 散射 图 像 等 。 图 像 融合 可 分 为 3 个 层次 一 一 像素 层 、 特 征 层 和 决策 层 。 在 这 3 个 层 
次 上 ,可 借助 多 种 理论 工具 对 由 不 同 传感器 获取 的 数据 进行 综合 加 工 ,并 进行 协调 、 优 化 、 整 
合 , 从 中 提取 更 多 的 信息 或 获得 新 的 有 效 的 信息 ,从 而 提高 决策 能 力 。 

基于 内 容 的 视觉 信息 检索 抓 住 了 人 们 利用 图 像 和 视频 的 本 质 要 求 ,从 把 握 图 像 和 视频 
的 高 层 语义 内 容 着 手 来 实现 对 视觉 信息 的 查询 利用 。 对 内 容 的 分 析 可 在 不 同 层次 进行 , 首 
先是 较 低 的 视觉 感知 层 (利用 颜色 ` 纹 理 、 形 状 . 运 动 .空间 位 置 和 关系 等 视觉 特征 ) ,其 次 是 
中 间 的 认 知 层 (包括 识别 目标 的 目标 层 和 分 类 场景 的 场景 层 ) ,最 后 还 有 较 高 的 主观 抽象 层 
(取决 于 用 户 的 情绪 或 情感 状态 、. 环 境 气 氛 等 ) 。 

时 空 行为 理解 的 目标 是 在 充分 掌握 时 空 信息 的 基础 上 (例如 利用 对 场景 中 各 种 目标 在 
时 间 和 空间 上 的 全 面 检测 和 跟踪 ) 借 助 知识 进行 推理 .判断 举止 .解释 场景 。 具体 来 说 ,需要 
判断 场景 中 有 哪些 景物 \ 它 们 随时 间 如 何 改变 其 在 空间 的 位 置 、 姿 态 、 速 度 、 关 系 等 ,从 而 可 
以 在 时 空中 把 握 景 物 的 动作 、 确 定 动作 的 目的 ,并 进而 理解 它们 所 传递 的 语义 信息 。 它 涉及 
时 空 兴趣 点 的 检测 动态 轨迹 和 活动 路 径 的 跟踪 、 动 作 的 分 类 、 活 动 的 识别 事件 和 行为 的 建 

对 视觉 场景 的 理解 可 表述 为 在 视觉 感知 场景 环境 数据 的 基础 上 ,结合 各 种 图 像 技术 ,从 
计算 统计 ,行为 认 知 以 及 语义 等 不 同 角度 挖掘 视觉 数据 中 的 特征 与 模式 ,从 而 实现 对 场景 的 
有 效 分 析 和 理解 。 在 图 像 工 程 的 高 层 工作 常 涉及 多 个 层次 (上 述 几 个 研究 应 用 领域 就 是 很 
好 的 例子 )。 事 实 上 ,对 场景 的 分 析 和 请 义 解释 都 可 分 3 个 层次 进行 。 

(1) 局 部 层 : 该 层 主要 强调 对 场景 的 局 部 或 单个 景物 的 分 析 、 识 别 或 对 图 像 区 域 进 行 
标记 ; 

(2) 全 局 层 : 该 层 考虑 整个 场景 的 全 局 ,关注 具有 相似 外 形 和 类 似 功能 的 景物 的 相互 
关系 ; 

(3) 抽象 层 : 该 层 对 应 场景 的 概念 含义 ,要 给 出 对 场景 抽象 的 描述 和 解释 。 

本 章 的 问题 涉及 上 述 高 层 研 究 应 用 多 个 方面 的 概念 。 








17-1 贝 叶 斯 分 类 器 的 边界 函数 


名 题 面 : 

对 如 下 具有 高 斯 概率 密度 函数 的 2-D 模式 类 ,计算 贝 叶 斯 分 类 器 的 边界 函数 并 夯 出 边 
界 图 。 

Gidesys {LOO L201 L221 Bo20} ss {au [6 L661 [Lt 0 
P(s1)=P(s,)=1/2; 

(Cosrs tL =—=L0ds LG = Ly Os LO bs = = E2700 
[0 2]7},P(s)=2/3,P(s,)=1/3。 

了 3 解析 : 

(1) 两 个 模式 类 的 均值 矢量 分 别 为 


两 个 模式 类 的 协 方差 矩阵 为 


as-c-|， | 
= 2 |0 1 


因为 C=I, 且 P(s1)==P(ss)==1/2, 所 以 得 到 边界 函数 为 
di(x)— ds(x) tn 一 一 上 gi 填 Sig 一 28) di — dvs t+ 24 0 
边界 图 如 图 解 17-1(1) 所 示 。 
(2) 两 个 模式 类 的 均值 矢量 为 














两 个 模式 类 的 协 方差 矩阵 分 别 为 


两 个 模式 类 的 决策 函数 为 
di(x) mn : ) | L ) (zf 二 zx) m2 (zf + zx) 
da(x) nl( L ) 1 ln(2) a 拉动) m (起 ] 7 Ci 2 


3 
所 以 边界 函数 为 




















3 
4 


这 个 边界 函数 不 是 线性 的 ,实际 上 是 一 个 圆 的 方程 (二 次 曲线 ), 即 


过 十 戏 一 In(4) = 1. 36: 








di(x) —d2(x) = ln(4) (zxf+zxi)=0 





边界 图 如 图 解 17-1(2) 所 示 。 
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0 上 
要 
图 解 17-1(1) 贝 叶 斯 分 类 器 的 边界 函数 图 图 解 17-1(2) ” 贝 叶 斯 分 类 器 的 边界 函数 图 
17-2 贝 叶 斯 融合 
名 题 面 : 


假设 有 两 类 目标 (i 二 1, 2) ,其 出 现 概率 分 别 为 P(A) 和 P(A,); 有 4 种 传感器 (7 一 1， 

2, 3, 4) ,其 测量 值 Bj 满足 高 斯 分 布 N (yw ,0 )。 已 知 各 测量 值 的 先 验 条 件 概 率 密度 为 
1 exp (= i 二 

V2N oj 20k 
给 出 根据 贝 叶 斯 条 件 概 率 进行 融合 的 结果 。 

如 解析 : 

先 计 算 各 测量 值 的 先 验 条 件 概 率 密度 ,这 可 用 如 下 方法 得 到 : 设 观 察 值 发 生 在 先 验 概 
率 分 布 均值 上 的 概率 为 1, 则 实际 观察 值 的 概率 是 以 均值 为 中 心 的 两 侧 概率 之 和 , 即 


P(B, | A,) = 2 Be | A PB: | AN= 路 Sta | A Sab 
1 1 








2 
P(B,; | A;) 2 )， i=1,2; j=1,2,3,4 


PB | A = 2 cbs | A db PB | 为 六 一 2 plbs | As)db, 
2 2 


P(B, | A1) = 2 pO | a Bb [Ay = 2 pl6s | As) dbs 
, , 


P(B, | Ai) = 2 plb | AVdb, PCB |A:)= 2 plbs | As) dos 
4 4 
最 终 融 合 结果 可 表示 为 
PCA, | Bi A Bs 人 Bs A B) =_ PB | A)P(B, | Ai)P(CB: | A)P(B, | AD)P(CAD) 








DPCB: | AD)P(B。 | Ai)P(B: | A)PCB, | A) P(A)) 
j=1 


i = 12 


17-3 图 像 配 准 


部 题 面 : 
为 实现 图 像 融合 ,需要 先 将 图 像 配 准 。 假 设 需要 配 准 的 两 幅 图 像 如 图 题 17-3 所 示 , 试 
实现 一 种 配 准 算法 ,计算 需要 的 配 准 变换 ,将 这 两 幅 图 像 配 准 好 。 
RE 





图 题 17-3 ”需要 配 准 的 两 幅 图 像 

气 解析 
采用 基于 形状 泽 尔 尼克 和 抢 的 配 准 方法 ,计算 出 的 平移 参数 为 三 = 一 66.45 和 了 .一 
96.05 ,旋转 参数 0= 26. 49, 放 缩 参 数 S=1. 01。 按 这 些 参 数 进行 变换 得 到 的 结果 如 
图 解 17-3(a) 所 示 ,而 变换 后 得 到 的 两 图 配 准 结果 如 图 解 17-3(b) 所 示 , 可 见 对 应 线条 都 能 


重合 上 。 








图 解 17-3 配 准 后 的 两 幅 图 像 


17-4 图 像 拼 接 


要 将 两 幅 图 像 拼接 起 来 , 先 要 将 它们 进行 图 像 配 准 。 给 定 如 图 题 17-4 所 示 的 两 幅 有 部 
分 区 域 重 合 的 图 像 , 试 通过 配 准 变换 ,将 这 两 幅 图 像 拼接 起 来 。 





图 题 17-4 需要 拼接 的 两 幅 图 像 








图 解 17-4 








用 解析 : 
通过 调整 图 像 尺寸 , 使 重合 部 分 的 相关 度 最 高 ,借助 插值 得 到 的 结果 见 图 解 17-4。 





图 解 17-4 ”拼接 的 结果 





17-5 粗糙 集 分 类 


气 题 面 : 

在 进行 多 传感器 信息 融合 时 ,可 以 借助 粗糙 集 理 论 。 现 在 假设 给 定 知识 库 K = (L， 
R) ,其 中 区 一 {zo，zi，…，xz6} ,及 为 一 个 等 价 集 , 且 有 等 价 类 El 二 {zo, zi1},E:={zxi, x， 
ZX6) ,Es 二 {zx3， Zs}。 试 对 下 列 4 个 集合 进行 分 类 : 

(1) X= {zo, zi1} 

(2) Xs,= {zo, x2} 

(3) R= {Tos Wis Tay Ty} 

(4) X= {zo Ts» Ts Te} 

如 解析 : 

(1) R. (KX)={X1 EL R(XI) 三 X11}=Ei= {zx0s zi} 

R* (Xi)={X1EL: R(X1) NM XA @}={zx0, x1} 
Br(X1)=R" (X1) — R. (Xi)={@)} 
dr(X1)=1 
“Xi 是 等 价 关 系 RR 的 可 定义 集 
(2) R. (X,)={X, EL: R(X;) CS X.}=8 
R’* (X,)={X EL: R(X;) 站 XA @}=EUE,={zxo, Xi, Xs, X14, Xe} 
Br(X,)=R"* (Xs) — R,. (Xs)={z0, Xi, Zs, Xs, Te} 
dr(X:)=0 

…X。 是 等 价 关 系 R 的 内 不 可 定义 集 。 

(3) R.(X3)={X3 EL: R(X3) CS Xs}=E,= {zxo, zx1} 

R’* (Xi3)={X3EL: R(Xs) NM Xs @}=EU EU FE 
={Zz0s Xi, Zs, T4, Te» Ts3, Ts}—=L 

Br (Xs)=R"* (Xs) — R. (Xs3)={zs, Zs, Ts, Xs, Te} 

dr (Xs)=2/5 

“…X3 是 等 价 关 系 R 的 外 不 可 定义 集 。 

(4) R. (XA)={X EL;: ROX) CS Xi 一 已 :一 (zz zi ze} 

» L9G 到 


R(xXD—{X EEL: RCN) NM KBU BB—{n mi mo ms a } 
Ba(X)=R"* (X) — R,(X,)={z0s ri} 
dr (X41)=3/5 

……X4 是 等 价 关 系 R 的 粗糙 可 定义 集 。 


17-6 中 心 矩 法 


各 题 面 : 

考虑 图 题 17-6 中 的 3 个 直方 图 。 如 果 设 查询 图 像 Q 的 RG、B 分 量 直 方 图 分 别 如 
昌 1 、.H;、Hs 所 示 , 而 数据 库 图 像 D 的 RG、B 分量 直方 图 分 别 如 互 。 有 : 、B 所 示 , 用 中 心 
矩 法 计算 两 图 的 匹配 值 。 








H(A 9 9 及 (0 HD oo 9 
7 7 交 7 
TT 区 秆 水 续 必 了 这 01234567k 01234567k 
图 题 17-6 ”3 个 直方 图 
所 解析 ， 


先 计算 查询 图 的 3 个 中 心 矩 
Mi = 5 WR = 痪 ， MB = 68. 44 
Mi = 40625s MS = 21.4375; ME = 125 
Mbs = 3. 875, 和 = 20， Mai = 116. 375 
再 计算 数据 库 图 的 3 个 中 心 矩 
Mk: = dD0025: Mis= A Wi = 5 
Mie = 3.875, Mi = 20， Mi = 116. 375 
Mbs = 3.125, NM 和 = 14.75， Mi = 68. 44 
所 以 两 图 的 匹配 值 : 





3 3 3 
P(Q,D)= we (MB — Mr)’ 十 We>) (Ma 一 Mie) + Wa >) Mis — Mbs)’ 
ii 一 1 i=1 i=]1 


= 10. 6741 


17-7 词 袋 模型 与 费 舍 尔 矢 量 比 较 


各 题 面 : 
词 袋 模型 方法 一 般 借 助 尺度 不 变 特征 变换 (SIFT) 算 子 进行 图 像 检 索 , 试 列表 将 它 与 先 
用 SIFT 特征 构建 描述 符 再 用 费 合 尔 矢量 进行 聚合 的 方法 比较 。 
所 解析 : 
词 袋 模型 方法 与 费 舍 尔 矢量 方法 在 几 个 方面 的 比较 见 表 解 17-7。 
» L9T % 


表 解 17-7 词 袋 模型 方法 与 费 舍 尔 矢量 方法 的 比较 




















比较 项 目 词 袋 模型 费 合 尔 矢量 
复杂 度 | 较 训 区 低 
性 能 “| 一 般 ( 准 确 度 较 高 ,但 速度 慢 ) 较 好 (准确 度 较 高 ,速度 也 较 快 ) 
从 点 | 详 用 区 轩 广 , 较 强 的 局 部 撞 述 能 力 ,检索 符 | 局 部 指 述 能 力 与 全 局 撞 术 能力 结 合 , 搬 述 能 
所 | 定 目标 时 准确 率 较 高 力 加 强 ,计算 量 有 所 下 降 
提前 针对 数据 库 建立 倒 排 表 比 较 费 时 间 , 基 人 
缺点 | 于 SIFT 算 于 而 计算 量 大 ,一 般 应 用 于 固定 | 全 估 村 征 因 生生 居 枯 全 
的 数据 集 
17-8 灰 度 图 和 彩色 图 检索 
气 题 面 ， 
选取 同一 幅 图 像 的 灰 度 和 彩色 版 本 在 网 上 使 用 搜索 引擎 进行 图 像 检 索 ,给 出 排名 前 十 
的 结果 。 
名 解析 : 


选取 Lena 图 像 ,其 灰 度 和 彩色 版 本 分 别 见 图 解 17-8(1)。 





图 解 17-8(1) 灰 度 和 彩色 Lena 图 像 


用 灰 度 Lena 图 像 在 网 上 使 用 搜索 引擎 检索 得 到 的 前 10 幅 图 像 如 图 解 17-8(2) 所 示 。 
虽然 在 亮度 .尺度 .分辨 率 等 方面 有 所 不 同 , 但 人 物 都 是 正确 的 。 


jy 


‘ 





图 解 17-8(2) 以 灰 度 Lena 图 像 检 索 的 结果 


“ L986 二 


用 彩色 Lena 图 像 在 网 上 使 用 搜索 引擎 检索 得 到 的 前 10 幅 图 像 如 图 解 17-8(3) 所 示 。 虽 
然 前 7 幅 图 像 在 主 颜 色 . 尺 度 、 分 辨 率 有 些 不 同 , 甚 至 第 四 幅 还 镜像 反 转 了 ,但 人 物 都 是 正确 
的 。 第 八 幅 图 像 是 灰 度 图 像 ,第 九 幅 图 像 上 覆盖 了 一 层 蓝 色调 ,这 说 明 在 检索 中 除了 颜色 还 利 





用 了 其 他 特征 。 最 后 ,第 十 幅 图 像 中 的 人 物 变 了 ,似乎 检索 方法 中 没有 结合 人 脸 识别 的 信息 。 














图 解 17-8(3) 以 彩色 Lena 图 像 检 索 的 结果 图 解 17-8(3) 


17-9 自拍 图 的 检索 





各 题 面 : 
自己 拍摄 一 幅 图 像 并 在 网 上 使 用 搜索 引擎 进行 图 像 检索 ,根据 检索 结果 分 析 所 借助 的 
特征 。 
扣 解 析 : 
从 室内 向 外 所 拍摄 的 一 幅 图 像 如 图 解 17-9(1) 所 示 , 而 检 
索 得 到 的 前 8 幅 图 像 如 图 解 17-9(2) 所 示 。 可 见 , 图 中 的 景物 
类 型 ,包括 天 空 、 建 筑 、 树 木 、 马 路 , 均 基 本 一 致 ; 图 中 的 色调 、 
色彩 氛围 也 比较 相似 。 应 该 是 综合 使 用 了 包括 颜色 (各 图 均 有 
-小 部 分 偏 红色 的 区 域 和 相当 偏 绿 色 的 区 域 ) .纹理 (树木 与 密 
集 的 建筑 ) 形状 (建筑 外 表面 的 平行 边缘 ) 和 空间 分 布 ( 远 处 的 
天 空 、 中 景 的 建筑 和 民房 、 近 处 的 树木 ) 等 多 种 特征 。 图 解 17-9(1) ”自拍 图 像 











图 解 17-9(2) 检索 到 的 一 些 图 像 图 解 17-9(2) 
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17-10 活动 剖析 


各 题 面 : 

试 分 析 讨 论 将 “活动 “事件 ”和 “行为 ”分 别 放 在 同一 个 层次 和 放 在 3 个 不 同 层次 的 理 
由 。 它 们 在 哪些 应 用 场合 需要 区 分 ? 在 哪些 应 用 场合 不 需要 特别 区 分 ? 

气 解析 : 

首先 , “活动 “事件 ”和 “行为 "在 本 质 上 都 是 主体 /发 起 者 为 完成 某 个 工作 或 达到 某 个 目 
标 而 执行 的 一 系列 动作 的 逻辑 组 合 。 从 广义 上 讲 ,它们 都 属于 活动 。“ 事 件 " 多 强调 在 特定 
时 间 段 和 特定 空间 位 置 发 生 的 某 种 异常 活动 ,行为 ?更 关注 主体 /发 起 者 受 主观 思想 支配 进 
行 的 有 特定 目标 的 活动 。 它 们 都 可 看 作 “ 活 动 ”* 的 特例 ,所 以 三 者 可 放 在 同一 个 层次 。 

然而 , “活动 “事件 ”和 “行为 "之 间 又 有 抽象 程度 逐渐 增强 、 递 进 的 关系 :“ 事 件 ” 是 满足 
某 些 规则 的 特定 动作 的 组 合 ,而 “行为 ”是 主观 驱动 的 “事件 的 组 合 。 从 三 者 之 间 的 递 进 从 
属 关系 看 ,也 可 将 它们 放 在 3 个 不 同 层次 。 

一 般 来 说 , 当 比 较 关 注 活动 的 客观 结果 并 对 抽象 层次 的 要 求 较 低 时 ,可 不 必 特 意 区 分 三 
者 ; 当 对 抽象 层次 的 要 求 较 高 且 强调 不 同 概念 处 在 不 同 层次 时 ,可 以 更 细致 地 进行 区 分 。 


17-11 路径 学 习 方法 





名 题 面 : 

对 活动 路 径 (AP) 的 学 习 方 法 有 3 种 基本 的 结构 ,如 图 题 17-11 所 示 。 在 图 题 17-11(a) 
中 ,输入 的 是 活动 在 某 个 时 刻 的 单个 轨迹 ,路 径 中 的 各 点 隐 含 地 在 时 间 上 排 了 序 , 所 以 学 习 
的 结果 是 活动 轨迹 的 各 个 组 成 部 分 。 在 图 题 17-11(b) 中 ,一 个 活动 的 各 段 轨迹 被 用 作 学 习 
算法 的 输入 以 直接 建立 输出 的 活动 路 径 。 在 图 题 17-11(c) 中 ,将 视频 片段 (video clip, ve) 
按时 序 分 解 为 各 段 路 径 , 对 它们 用 一 组 动作 单词 来 进行 描述 ,或 者 说 视频 片段 根据 动作 单词 
的 出 现 而 被 赋予 某 种 活动 的 标签 。 

活动 ” 隐 含 顺序 ”路 径 轨迹 路 径 
CC 





图 题 17-11 3 种 基本 的 路 径 学 习 结构 


试 讨论 这 3 种 路 径 学 习 算 法 各 适合 于 哪些 应 用 场合 。 

各 解析 : 

图 题 17-11(a) 中 的 结构 适合 于 刻画 单个 轨迹 点 的 动作 和 活动 ,可 以 描述 瞬间 的 场景 
(场景 中 的 静止 物 、 背 景 参 照 物 ,如 乒乓 球台 )。 它 可 以 用 于 路 径 建 模 ,分 析 目 标 可 能 的 运动 
范围 .轨迹 ,判断 视频 中 场景 的 切换 ,或 预测 路 径 在 两 个 点 之 间 的 概率 。 

。 200 ， 


图 题 17-11(b) 中 的 结构 适用 于 刻画 ( 沿 轨迹 ) 连 续 动 作 和 活动 ,可 以 描述 持续 一 段 时 间 
长 度 的 场景 (如 乒乓 球 运 动员 的 一 次 发 球 )。 它 可 以 描述 连续 的 动作 行为 ,如 交通 行为 物流 
分 析 、 动 物 习 性 等 。 它 适用 于 提取 轨迹 的 相似 性 或 判断 轨迹 的 异常 ,实现 路 径 分 类 和 活动 分 
析 或 事件 检测 。 

图 题 17-11(c) 中 的 结构 把 视频 片段 分 解 成 一 组 动作 单词 并 打上 标签 以 描述 活动 。 它 
可 以 建立 从 基本 动作 出 发 到 高 层 行为 语义 的 解释 ,或 描述 带 有 明确 意义 的 几 个 运动 轨迹 序 
列 ( 如 乒乓 球 比 赛 中 的 一 局 ) ,或 判断 同一 目标 在 不 同位 置 和 不 同时 刻 的 活动 情况 。 


”SOL ® 
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各 种 图 像 技术 可 以 看 作 是 利用 计算 机 来 实现 人 类 的 视觉 功能 ,以 达到 对 客观 世界 中 时 
空 场景 的 感知 ,分 析 、 识 别 和 和 解释。 这 里 ,对 人 类 视觉 机 理 的 充分 理解 也 会 促进 图 像 技术 的 
深入 研究 和 广泛 应 用 。 

视觉 是 人 类 了 解 世界 的 一 种 重要 功能 。 视 觉 包括 * 视 ”和 "* 觉 ?两 个 步骤 或 两 个 阶段 ,所 
以 视觉 也 可 进一步 分 为 视 感觉 和 视 知 觉 。 

视 感觉 主要 是 从 分 子 的 观点 来 理解 人 类 对 光 ( 可 见 辐 射 ) 的 反应 的 基本 性 质 , 它 主要 涉 
及 物理 ,化 学 ,生理 等 。 视 感觉 中 主要 关注 和 研究 : 光 的 物理 特性 (如 光量 子 、 光 波 、 光 谱 
等 ) , 光 刺 激 视 觉 感受 器 官 的 程度 和 人 性质 (如 光度 学 ,视觉 适应 .时 空 特性 等 ), 光 作用 于 视 网 
膜 后 经 视觉 (神经 ) 系 统 加 工 而 产生 的 感觉 (如 明亮 程度 ,浓淡 色调 等 ) 。 

视 知 觉 主 要 论述 人 从 客观 世界 接受 视觉 刺激 后 如 何 反应 以 及 反应 所 采用 的 方式 和 所 获 
得 的 结果 , 兼 有 心理 因素 。 视 知觉 是 在 神经 中 枢 进行 的 一 组 活动 , 它 把 视野 中 一 些 分 散 的 刺 
激 加 以 组 织 ,构成 具有 一 定形 状 和 结构 的 整体 ,并 据 此 以 进一步 认识 客观 世界 。 视 知觉 又 可 
分 为 亮度 知觉 ,彩色 知觉 .形状 知觉 .空间 知觉 和 运动 知觉 等 。 

本 章 的 问题 涉及 上 述 视 感觉 和 视 知 觉 多 个 方面 的 概念 。 


18-1 锥 细胞 的 排列 与 视网膜 上 的 分 辨 率 





忌 题 面 : 

假设 在 人 眼中 央 止 处 锥 细胞 以 约 为 2.4X10 习 mm 的 间隔 均匀 排列 , 当 人 观察 2m 外 的 
黑白 栅 格 时 晶状体 聚焦 中 心 和 视网膜 之 间 的 距离 为 16mm, 此 时 可 分 辨 出 相距 多 远 的 同色 
栅 格 条 呢 ( 视 网 膜 上 的 空间 分 辩 率 为 两 倍 锥 细胞 间隔 的 倒数 )? 

名 解析 : 

视网膜 上 的 分 辨 率 为 两 倍 锥 细胞 间隔 的 倒数 , 即 (1/4.8)X10/mm, 中 央 四 处 两 相 邻 锥 
细胞 对 栅 格 的 张 角 为 6 sin(9) 二 4.8X10 怀 /16 二 3X10 rad, 在 这 个 张 角 下 ,距离 2m 外 
可 分 辨 的 间隔 为 2X103X3X10 一 一 0.6mm。 


18-2 视 敏 度 
各 题 面 : 
视 敏 度 对 设计 视觉 系统 有 什么 实际 意义 ? 
扣 解 析 : 


视 敏 度 表 达 了 视觉 系统 观察 景物 精致 细节 的 能 力 。 它 与 视觉 系统 中 采集 单元 的 排列 、 


面积 的 大 小 .目标 和 背景 的 对 比 度 , 以 及 场景 的 亮度 .景物 的 距离 观察 的 时 间 ,甚至 采集 器 
的 注视 或 运动 等 情况 都 有 关 ,而 且 常 常 不 是 简单 的 线性 关系 。 所 以 设计 视觉 系统 必须 考虑 
视 敏 度 ,以 满足 功能 要 求 和 获得 最 好 的 性 能 。 


18-3 人 类 视觉 系统 感知 彩色 


所 题 面 : 

除了 使 用 三 基色 直接 混合 来 获得 彩色 外 ,还 有 许多 方法 可 以 获得 与 其 相同 的 视觉 效果 ， 
例如 : 

(1) 将 三 基色 光 按 一 定 顺 序 快速 轮流 地 投射 到 同一 表面 ; 

(2) 将 三 基色 光 分 别 投射 到 同一 表面 上 相距 很 近 的 3 个 点 ; 

(3) 让 两 只 眼睛 分 别 观测 不 同 颜色 的 同一 图 像 。 

指出 这 些 方 法 分 别 利用 了 人 类 视觉 系统 的 哪些 性 质 ? 

名 解析 : 

(1) 视觉 惰性 或 视觉 暂 留 特性 (时 间 混 色 法 的 基础 ,顺序 制 彩色 电视 的 基础 ) ; 

(2) 人 有 眼 分 辨 率 的 有 限 性 (空间 混 色 法 的 基础 ,同时 制 彩色 电视 的 基础 ); 

(3) 生理 混 色 (两 只 眼睛 获得 两 种 彩色 印象 ,会 在 人 的 大 脑 中 产生 相 加 混 色 的 效果 ) 。 


18-4 图 形 的 良好 性 


名 题 面 : 

将 2 个 点 排列 在 一 个 3x3 的 矩阵 中 ,一 共 可 以 组 成 36 种 不 同 的 变换 图 形 。 试 将 这 些 
图 形 根据 其 "良好 性 ”进行 分 组 ,每 组 中 的 图 形 之 间 可 通过 旋转 或 镜像 映射 而 互相 转换 。 

所 解析 : 

图 解 18-4 给 出 了 这 36 种 图 形 。 图 解 18-4(a) 和 图 解 18-4(b) 具 有 最 好 的 “良好 性 ”, 它 
们 每 种 都 只 另 有 一 个 变形 。 图 解 18-4(c) 、 图 解 18-4(d) 、 图 解 18-4(e) 和 图 解 18-4(f) 具 有 其 
次 的 “良好 性 ”, 它 们 每 种 都 另 有 3 个 变形 。 图 解 18-4(g) 和 图 解 18-4(h) 具 有 最 差 的 “良好 
性 ”, 它 们 每 种 都 另 有 7 个 变形 。 
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18-5 眼 肌 运动 


各 题 面 : 

儿童 和 成 人 的 双 目 距离 一 般 不 同 , 谁 的 眼 肌 运 动 给 大 脑 
提供 的 物体 距离 信息 更 多 ? 

如 解析 : 

设 双 目 距离 用 M 表示 , 物 距 用 D 表示 , 则 根据 如 图 解 18-5 
的 双眼 视 轴 幅 合 图 ( 取 成 人 M 二 65mm) ,有 


的 - 


给 定 D,M 小 则 9 小 。 一 般 儿 童 的 双 目 距离 较 成 人 短 , 所 以 控 
制 视 轴 幅 合 的 眼 肌 运 动量 会 较 小 。 反 过 来 ,儿童 用 相同 的 眼 “图解 18-5 双眼 视 轴 幅 合 图 
肌 运 动 会 给 大 脑 提供 比 成 人 更 多 的 物体 距离 信息 。 


18-6 单 目 深度 线索 





如 题 面 : 

试 列举 一 些 单 目 深度 线索 的 实例 。 

要 解析 : 

可 对 各 种 单 目 深度 线索 分 别 举例 。 

(1) 画 画 时 , 常 将 远 处 得 部 分 画 得 暗 些 ,而 近 处 的 部 分 画 得 亮 些 ,这 能 加 强 远近 不 同 的 
感觉 ; 我 国 古代 画家 常 对 近 处 风景 以 浓重 (红色 、 棕 色 ) 的 颜色 ,对 远景 以 清淡 (青色 、 蓝 色 ) 
的 颜色 来 表现 空间 效果 。 

(2) 景物 表面 的 光亮 与 阴影 也 常 给 人 以 凸凹 的 感觉 。 

(3) 在 城市 住 惯 的 人 初 到 野外 山区 时 ,常常 会 将 与 远 处 山峰 之 间 的 距离 估计 得 过 近 ,这 
是 因为 野外 山区 空气 比较 清新 ,视野 清晰 ,而 人 们 常 觉得 看 得 清楚 的 东西 比 模糊 不 清 的 东西 
要 近 一 些 。 

(4) 火车 轨道 下 的 枕 木 ,已 知 等 长 ,但 所 成 像 尺寸 不 同 , 越 远 越 短 ,所 以 可 产生 深度 
效应 。 

(5) 文艺 复兴 以 来 的 画家 常 利用 线条 透视 而 在 平 的 画面 上 表现 出 有 深度 的 空间 关系 。 

(6) 人 在 铺 满 砖 头 的 路 上 向 远方 观察 ,会 有 近 处 砖 块 稀 政 、 远 处 砖 块 密集 的 感觉 。 

(7) 一 般 电 影 中 由 于 缺乏 双眼 空间 知觉 的 条 件 ,为 表现 空间 距离 , 常 使 摄像 机 运动 或 让 
被 拍摄 对 象 运动 ,如 风吹草动 等 都 可 突出 深度 感 。 

(8) 远 处 的 飞机 如 被 云层 遮挡 , 则 可 知 飞机 相对 较 远 。 


18-7 恒 常 性 程度 
名 题 面 : 


对 知觉 恒 常 性 可 以 借助 比率 来 定量 表示 。 比 率 Rs 二 (R 一 S)/(C 一 S) 常 用 来 表示 大 小 
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知觉 的 恒 常 性 程度 ,其 中 尺 为 知觉 大 小 ; S 为 按 视角 计算 的 大 小 ; C 为 物理 大 小 。 试 探讨 
Rs 随 S 变化 的 情况 。 

气 解析 : 

实际 中 ,一 般 有 C 宇 R 宇 S$。 现 设 C= 一 10, 取 若干 个 尺 ,变化 S, 得 到 表 解 18-7。 其 中 ， 
R=10 时 ,不 论 S 取 什 么 值 (以 z 代表 )Rs 都 为 1( 具 有 完全 恒 常 性 )。 


表 解 18-7 Rs 随 S 变化 的 情况 





区 0 1 2 3 4 5 6 bj 8 9 0 二 2 3 4 5 
























































Re 1 |9/10| 8/9 | 7/8 | 6/7| 5/6 | 4/5 | 3/4 | 2/3 | 1/2 | 0 |1/2|4/9|3/8|2/7|1/6| 0 


为 了 更 直观 地 观察 Rs 随 S 变化 的 情况 ,根据 

表 解 18-7, 可 画 出 图 解 18-7。 由 图 可 见 , 当 R=C 

时 , 恒 常 性 起 决定 性 作用 ,视角 变化 不 影响 知觉 大 

小 。 当 尺 比较 接近 C 时 ,Rs 随 S 的 变化 呈现 先 慢 

后 快 的 下 降 , 即 恒 常 性 程度 开始 比较 强 , 后 来 迅速 

减弱 。 当 尺 与 C 差距 比较 大 时 ,Rs 随 S 的 变化 几 

全 乎 呈 直 线 下 降 , 并 最 后 降 到 零 , 即 恒 常 性 程度 基本 

与 视角 大 小 成 反比 ,并 在 视角 大 小 S 与 知觉 大 小 尺 
相等 时 降 到 完全 无 恒 常 性 。 


18-8 ” 远 距离 时 的 大 小 知觉 恒 常 性 

















图 解 18-7 Rs 随 S 变化 曲线 








各 题 面 : 

对 大 小 感知 的 知觉 恒 常 性 是 与 观察 者 和 目标 之 间 的 距离 有 关 的 。 当 这 个 距离 比较 大 
时 ,知觉 大 小 与 距离 是 什么 样 的 关系 ? 

扣 解 析 : 

当 观察 者 和 目标 之 间 的 距离 大 于 
lkm 后 ,知觉 恒 常 性 的 影响 迅速 下 降 , 视 
网 膜 上 视 像 尺寸 对 知觉 的 影响 逐步 增加 ， Rh 
即 对 大 小 的 知觉 越 来 越 接近 几何 光学 的 | 十 
投影 规律 。 设 距离 用 D 表示 ,知觉 大 小 用 wa 
及 表示 , 则 在 1 一 10km 的 范围 内 ,R(D) 可 Mery 
用 图 解 18-8 中 的 曲线 来 表示 。 其 中 , 距 0 








离 为 lkm 时 ,知觉 大 小 取 为 1; 则 距离 为 “|[ 
2km 时 ,知觉 大 小 会 降 为 一 半 ,而 距离 为 0 2 4 6 8 10 5 
10km 时 ,知觉 大 小 会 降 到 1/10。 图 解 18-8 ” 远 距离 时 知觉 大 小 随 距 离 变 化 的 曲线 
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18-9 透视 缩放 和 透视 缩短 


各 题 面 : 

手 拿 一 支 铝 笔 , 闭 上 一 只 眼睛 ,用 另 一 只 眼睛 观察 : 

(1) 如 果 保 持 笔 轴 与 两 眼 之 间 的 连 线 平行 并 且 将 笔 从 眼前 逐渐 向 远方 移动 ,此 时 , 笔 的 
视 像 的 尺寸 变化 是 由 于 透视 缩放 还 是 透视 缩短 ,或 两 者 兼 而 有 之 ? 

(2) 如 果 将 笔 保持 在 距 眼 睛 一 定 的 距离 ,并 围绕 笔 的 中 心 在 水 平面 内 旋转 ,此 时 , 笔 的 
视 像 的 尺寸 变化 是 由 于 透视 缩放 还 是 透视 缩短 ,或 两 者 兼 而 有 之 ? 

名 解析 : 

(1) 在 将 笔 从 眼前 逐渐 远 移 时 ,如 果 保 持 人 眼 视线 的 方向 不 变 , 则 在 笔 的 移动 过 程 中 ， 
视线 轴 与 笔 之 间 的 夹 角 也 不 变 ,所 以 这 种 情况 下 笔 的 视 像 尺寸 变化 仅仅 是 由 于 透视 缩放 。 

(2) 当 笔 的 中 心 固定 , 且 笔 围绕 该 中 心 在 水 平面 中 旋转 时 ,透视 缩放 现象 源 自 笔 的 两 端 
与 眼睛 距离 的 变化 ,而 透视 缩短 现象 源 自视 线 轴 与 笔 之 间 的 夹 角 变化 。 所 以 这 种 情况 下 笔 
的 视 像 尺 寸 变 化 是 由 于 透视 缩放 和 透视 缩短 两 者 兼 而 有 之 。 


18-10 ”视野 随 运 动 速 度 的 变化 


名 题 面 : 

为 什么 人 在 道路 上 驾驶 汽车 时 , 随 着 速度 的 增加 会 感到 视野 减 小 ? 

扣 解 析 : 

这 中 间 涉 及 生理 ,心理 等 多 方面 的 因素 ,包括 ， 

(1) 人 在 路 上 驾驶 时 ,会 同时 观察 到 远近 不 同 的 景物 。 景 物 距离 的 不 同 会 导致 视角 改 
变 快慢 不 同 而 产生 的 差异 : 较 近 景物 的 视角 变化 大 , 较 远 景物 的 视角 变化 小 ,从 而 引起 相对 
运动 的 知觉 。 这 种 相对 运动 的 知觉 随 着 速度 的 增加 而 增加 ,使 得 对 远近 不 同 景物 之 间 的 相 
对 运动 知觉 更 明显 , 远 处 景物 占据 视野 的 时 间 更 长 , 驾 怠 人 对 远 处 景物 的 关注 更 多 ,会 感到 
视野 减 小 。 

(2) 人 对 视野 大 小 的 感觉 ,是 人 通过 对 所 看 到 的 远近 景物 进行 感知 分 析 而 得 到 的 结果 。 
人 有 眼 观察 物体 时 ,要 将 两 眼 都 对 准 景物 ,这 样 两 眼 视 轴 必须 完成 一 定 的 辐 合 运动 ,看 近 处 时 
要 趋 于 聚合 ,而 看 远 处 时 要 趋 于 分 散 。 当 人 高 速 运动 时 ,远近 景物 的 影像 会 快速 重要 ,使 得 
眼睛 一 直 处 于 聚合 的 状态 ,两 眼 的 光 轴 都 会 向 中 间 偏 移 而 交 又 ,两 眼 视野 的 中 央 部 分 会 重 
释 , 从 而 感觉 到 视野 集中 于 前 方 较 小 的 范围 。 

(3) 从 运动 视差 的 角度 分 析 。 当 汽车 加 速 时 , 近 处 的 景物 快速 后 退 , 而 远 处 的 景物 基本 
不 动 。 或 者 说 , 近 处 的 景物 与 观察 者 运动 接近 反 向 而 远 处 的 景物 与 观察 者 运动 接近 同 向 。 
此 时 , 近 处 的 景物 变 得 模糊 ,看 得 清 的 仅 是 远 处 的 景物 ,视角 就 变 小 了 ,视野 也 变 小 了 。 这 也 
可 解释 如 果 观 察 者 不 运动 ,而 景物 迎 向 观察 者 运动 时 的 情况 。 

(4) 人 向 前 运动 越 快 , 越 要 注意 远方 ,人 眼 的 水 平视 野 随 之 会 变 罕 ,观察 视角 也 会 变 小 。 
有 实验 表明 : 人 在 静止 状态 下 ,双眼 的 视角 约 为 210"; 当 汽 车 前 进 的 速度 为 40km/h 时 ,人 
双眼 的 视角 约 为 100"; 而 当 汽 车 前 进 的 速度 为 100km/h 时 ,人 双眼 的 视角 约 为 40"。 
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(5) 人 有 眼 成 像 是 一 个 投影 过 程 。 在 投影 空间 中 ,有 无 穷 远 点 (对 应 消失 点 ), 如 图 解 18-10 
所 示 。 消 失 点 在 人 的 视野 中 长 时 间 比 较 固定 ,得 到 持续 关注 ,这 部 分 较 小 的 视野 给 人 较 深刻 
的 印象 ,使 人 更 加 集中 了 精力 ,所 以 感觉 视野 变 小 了 。 





图 解 18-10 视野 中 关注 的 部 分 图 解 18-10 


18-11 视觉 感知 的 方法 


气 题 面 : 

研究 视觉 感知 的 方法 主要 分 两 类 : 分 析 方 法 和 合成 方法 。 讨 论 它 们 的 主要 观点 和 

各 解析 : 

分 析 方法 从 分 析 视 觉 机 理 中 的 刺激 开始 ,并 试图 将 孤立 的 科学 元 素 与 真实 感知 经 验 的 
各 个 环节 联系 起 来 。 这 种 方法 得 到 了 对 大 脑 结构 研究 结果 的 支持 ,人 们 已 发 现存 在 完成 基 
本 功能 的 特殊 细胞 ,例如 感知 边缘 、 线 条、 运动 方向 等 的 细胞 。 

所 有 分 析 理 论 都 基于 不 变 假设 (invariance hypothesis) 之 上 。 对 一 个 给 定 的 视网膜 投 
影 模 式 , 可 以 认为 可 能 有 无 穷 多 个 物体 会 导致 该 模式 的 产生 。 不 变 假设 认为 ,在 这 么 多 个 可 
能 的 物体 中 ,观察 者 总 会 选择 一 个 且 只 选择 一 个 。 这 个 经 验 模型 认为 不 变 假设 可 以 基于 实 
验 法 (trial-and-error) 重 复 应 用 : 如 果 一 个 应 用 被 证 明 是 错误 的 ,视觉 系统 通过 学 习 经 验 来 
“调整 ” 它 的 不 变 假 设 并 产生 其 他 假设 以 使 所 有 假设 都 对 应 一 个 可 能 的 模式 。 这 样 不 变 假设 
就 与 视觉 一 致 性 联系 起 来 了 。 例 如 ,方向 一 致 性 指 一 个 固定 物体 的 朝向 在 视网膜 图 像 变化 
的 情况 下 根据 对 物体 朝向 识别 的 算法 仍 保持 不 变 。 又 如 ,尺寸 一 致 性 是 将 视网膜 尺寸 与 景 
物 距 离 信息 相 联系 的 结果 , 它 帮 助 在 不 同 距离 上 判断 同一 个 物体 的 尺寸 。 

分 析 方 法 能 帮助 解释 一 些 现 象 。 例 如 ,有 一 些 对 每 个 人 或 多 或 少 相 似 的 有 特点 的 趋向 
(characteristic tendencies) ,如 等 距 倾向 ( 当 相对 距离 的 线索 不 太 清晰 时 ,物体 趋向 于 显得 同 
样 远 ) .特定 距离 倾向 ( 当 没 有 足够 的 有 关 绝 对 距离 的 数据 时 ,人 们 常 将 物体 看 作 处 在 某 个 特 
定 距离 ,如 2m) 。 一 般 来 说 ,如 果 视 觉 系统 缺少 解释 它 所 看 到 现象 的 某 些 因素 时 , 它 趋向 于 
做 出 某 种 决策 或 判断 而 不 是 不 做 解释 。 
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合成 方法 试图 对 视觉 世界 在 刺激 中 找 出 等 价 物 。 根 据 这 种 思路 ,视网膜 上 的 光学 图 像 
(包括 图 像 随时 间 的 变化 ) 应 该 包含 所 有 感知 空间 目标 需要 的 信息 。 人 类 的 感知 机 理 已 经 足 
够 完备 以 单独 地 完成 感知 工作 。 这 种 方法 有 两 个 重要 的 特点 : 

(1) 它 假设 人 们 在 观察 到 视网膜 图 像 结 构 中 的 变化 时 ,通过 参照 一 个 连续 的 曲面 和 一 
个 不 变 的 目标 ,可 将 暂时 在 视 场 之 外 的 物体 仍然 视 为 物体 。 顺 便 提 一 下 ,可 以 注意 到 这 个 想 
法 与 作为 电影 ( 某 种 程度 上 也 是 绘画 ) 表 现 核心 的 “屏幕 外 ”空间 的 相似 之 处 。 

(2) 它 依 赖 于 这 样 一 种 思想 , 即 复杂 的 和 密集 编码 的 视网膜 刺激 可 以 帮助 获得 视觉 世 
界 的 不 变量 及 其 最 基本 和 内 在 的 特性 。 吉 布 森 认 为 ,知觉 的 目标 是 提供 某 种 可 见 世 界 的 评 
估 尺 度 (当然 ,这 不 应 该 与 瞬间 视野 混淆 )。 运 动 和 顺序 性 以 及 时 间 对 于 构建 支撑 感知 世界 
的 空间 尺度 至 关 重要 。 
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数字 和 字母 


1-D 游程 编码 (1-D run-length coding)7-6 
3-D 重 建 (3-D reconstruction)13-11 

8- 连 接 (8-connectivity)16-18 

CCD 摄像 机 (CCD camera)1-3 

HSI 模型 (HSI model)8-8 

HSI 颜色 实体 (HSI color entity)8-7 
L? 范 数 (L? norm)8-2 

LZW 编码 (LZW coding)7-12 

m- 连 接 (m-connectivity)16-18 

RGB 模型 (RGB model)8-8 

RGB 彩色 立方 体 (RGB cube)8-5,8-6,8-7 


A 


鞍 谷 (saddle valley)12-3 
鞍 桨 (saddle ridge)12-3 


B 


巴特 沃 斯 带 通 滤波 器 (Butterworth band pass filter) 
5-20 

巴特 沃 斯 低 通 滤波 器 (Butterworth low pass filter) 
5-21 

饱和 度 增强 (saturation enhancement)8-10 

贝 叶 斯 分 类 器 (Bayesian filter)17-1 

贝 叶 斯 条 件 概 率 (Bayesian conditional probability) 
17-2 

背景 建 模 (background modeling)11-9 

本 质 矩 阵 (essential matrix)13-7 

闭合 (closing)16-7,16-8,16-15 

边 导 出 子 图 (edge induced sub graph)15-9 

边界 描述 符 (boundary descriptor)10-9 

边缘 检测 (edge detection)16-17 

边缘 增强 (edge enhancement)16-17 


变换 编码 (transform coding)7-15 
变焦 操作 (zoom operation)1-1 

泊 松 概率 (Poisson probability)10-10 
不 变 矩 (invariant moment)10-8 


© 


采样 操作 (sampling operation)1-1 

朝向 图 (oriented map)14-8 

成 像 模型 (imaging model)11-7,11-8 

城区 距离 (city block distance)16-10 

尺度 变换 (scaling transformation)3-4 

尺度 不 变 特征 变换 (scale invariant feature transform， 
SIFT)17-7 

窗 函 数 (window function)4-14 

垂直 倾斜 (tilting)14-7 

垂直 投影 (vertical projection)6-9 

词 袋 模型 (bag of words model)17-7 

从 影 调 恢 复 形状 (shape from shading)14-8,14-9 

粗糙 集 理论 (rough set theory)17-5 

粗 化 (thickening)16-13 ,16-14 


D 


代数 重建 技术 (algebraic reconstruction technique， 
ART)6-13 

单 目 深度 线索 (monocular indices of depth)18-6 

导出 子 图 (induced sub-graph)15-9 

等 距 变 换 (isometry transformation)3-8 

低 通 滤波 (low-pass filtering)5-18 

低 通 滤波 器 (low-pass filter)5-19,5-22 

顶 面 (top surface)16-19 

多 边 形 通 近 (polygonal approximation)10-1 

多 尺度 小 波 变 换 (multi-scale wavelet transform)8-15 

多 分 辨 率 (multi-resolution)9-12 


E 


二 阶 编码 (second-order coding)7-2 


二 值 分 解 (binary decomposition)7-5 
二 值 码 (binary code)7-4 


F 


方 盒 量 化 (square-box quantization)1-11 

仿 射 变换 (affine transformation)3-5,3-6,3-7,3-8,3-10 

放 缩 变换 (scaling transformation)3-4,3-7 

费 舍 尔 矢 量 (Fisher vector)17-7 

分 裂 (split)10-1 

分 区 编码 (zonal coding)7-13 

分 水 岭 (watershed)9-7,9-12 

分 形 维 数 (fractal dimension)11-6 

峰值 信 噪 比 (peak signal-to-noise ratio)8-2 

辐射 状 模糊 (radial blur)11-11 

腐蚀 (erosion)16-3 ,16-4,16-8,16-19 

负 累 积 差 图 像 (negative accumulative difference image， 
NADD8-12 

傅 里 叶 变换 (Fourier transform)4-2,4-3,4-13 

傅 里 叶 变 换 投 影 定 理 (projection theorem for Fourier 
transform)6-11 

傅 里 叶 描 述 符 (Fourier descriptor)10-5 

覆盖 算法 (the wrapper algorithm)12-9,12-10 


G 


改进 的 豪 斯 道夫 距离 (modified Hausdorff distance， 
MHD)15-11 

盖 伯 变换 (Gabor transform)4-15 

高 帽 变换 (top-hat transformation)16-7 

高 斯 概率 (Gauss probability)10-10 

高 斯 混合 模型 (Gaussian mixture model)11-10 

高 斯 金字 塔 (Gaussian pyramid)8-14 

高 斯 平滑 (Gaussian smoothing)5-13 

高 斯 球 (Gauss sphere)12-5 

高 斯 曲率 (Gaussian curvature)12-4 

高 斯 锐 化 (Gaussian sharpening)5-13 

高 斯 图 (Gauss map)12-1 

高 通 滤波 (high-pass filtering)5-18 

高 通 滤波 器 (high-pass filter)5-19 ,5-23 

骨架 (skeleton)10-9 

关系 匹配 (relationship matching)15-5 ,15-6 

光度 立体 学 (photometric stereo)1-8 

光 流 (optical flow)11-15 

光 流 (optical flow)1-8 

光 流 场 (optical flow field)11-14 

光 流 方程 (optical flow equation)11-13 
wi 


归 一 化 互相 关 (normalized cross-correlation)8-1,8-2 
归 一 化 距离 测度 (normalized distance measure) 
过 渡 区 (transition region)9-6,9-12 


H 


哈达 玛 变换 (Hadamard transform)4-5,4-7,4-12 

哈 尔 变换 (Haar transform)4-8,4-9,4-11,4-12 

险 尔 函数 (Haar function)4-10 

险 尔 小 波 (Haar wavelet)4-8,4-13 

险 夫 变换 (Hough transform)9-9,9-10,15-3 

哈 夫 曼 编码 (Huffman coding)7-1,7-2,7-7,7-8,7-9 

豪 斯 道夫 距离 (Hausdorff distance, HD)15-11 

灰 度 闭合 (gray-level closing)16-5 

灰 度 对 比 度 (gray-level contrast)5-9 

灰 度 共生 矩阵 (gray level co-occurrence matrix)11-1 

灰 度 码 (Gray code)7-4 

灰 度 码 分 解 (gray-code decomposition)7-5 

灰 度 膨胀 (gray-level dilation)16-2 

灰 度 一 梯度 散射 图 (grayscale-gradient scattering map) 
9-5 

灰 度 映射 曲线 (gray-level mapping curve)5-3,5-4 

恢复 转移 函数 (restoration transfer function)6-2 

活动 (activity)17-10 

活动 路 径 (activity path,AP)17-11 

霍 特 林 变 换 (Hotelling transform)4-20,4-21,4-22， 
4-23 ,7-15 


J 


奇 函数 (odd function)4-1 

击 中 一 击 不 中 变换 (hit-or-miss transform)16-9 

积分 曲率 (integral curvature)12-4 

基础 简单 图 (underlying simple graph)15-9 

极点 (epipole)13-5 

极 线 (epipolar)13-5,13-6 

几何 失真 校正 (geometric distortion correction)6-1 

剪 切 (shearing)1-4 

剪 切 变换 (shearing transformation)3-3 

椒盐 噪声 (pepper and salt noise)5-26 

焦距 (focal length)1-3 ,14-6 

结构 光 成 像 (structured light imaging)14-8,14-9 

结构 光 成 像 (structured light imaging)1-7 

结构 元 素 (structure element)16-1,16-2,16-3,16-5， 
16-6,16-10,16-12,16-13,16-19 

截断 哈 夫 曼 编 码 (truncated Huffman coding)7-9 

近似 系数 (approximation coefficient)4-17 


景深 (depth of field)1-4,14-6 

和 矩 保持 (moment preserving)9-11 

距离 (distance)2-6 

距离 测度 (distance measure)2-7 

距离 量度 函数 (distance measuring function)15-4 

距离 为 弧 长 的 函数 (function of distance-versus-arc- 
length)10-3 

聚合 (merge)10-1 

卷 积 道 投影 (convolution back-projection)6-12 

绝对 累积 差 图 像 (absolute accumulative difference 
image, AADI)8-12 

绝对 最 终 测 量 精度 (absolute ultimate measurement 
accuracy)9-14 

均 方 误差 (mean squared error)8-2 

均 移 滤波 (mean shift filtering)11-17 

均值 滤波 (mean filtering)5-17 


K 


卡尔 曼 滤波 (Kalman filtering)11-16,11-17 
开启 (opening)16-4,16-7,16-8,16-15 
空间 分 辨 率 (spatial resolution)18-1 
扩展 高 斯 图 (extended Gaussian image)12-5 


L 


拉 东 变换 (Radon transform)4-19 

拉 普 拉 斯 金字 塔 (Laplacian pyramid)8-14 

拉 普 拉 斯 均 方 误差 (Laplacian mean squared error)8-2 

拉 普 拉 斯 算 子 (Laplacian operator)9-2 

拉 普 拉 斯 值 (Laplacian value)9-3 

朗 伯 表面 (Lambertian surface)14-2,14-3 ,14-4 

类 间 最 大 交叉 炉 (maximum inter-class cross-entropy) 
9-12 

类 间 最 小 模糊 散 度 (minimum inter-class fuzzy 
divergence)9-12 

离散 距离 (discrete distance)10-14 

离散 余弦 变换 (discrete cosine transform)4-7 

离散 圆 盘 (discrete disc)2-5 

理想 带 阻 滤波 器 (ideal band-reject filter)6-6 

理想 镜面 反射 表面 (ideal specular reflecting surface) 
14-1 

理想 散射 表面 (ideal scattering surface)14-2,14-3， 
14-4 

立体 匹配 (stereo matching)13-8 

立体 视觉 (stereo vision)13-5,13-6,13-7,13-9,13-10， 
13-11 


粒子 滤波 (particle filtering)11-16,11-17 

连接 (connectivity)2-1 

连通 (connected)11-2 

连通 (connected)2-1 

连通 悖 论 (connectivity paradox)10-12 

链 码 (chain code)10-13 

链 码 长 度 (length of chain code)10-13 

良好 性 (goodness)18-4 

亮度 (brightness/luminance)1-5,1-6,8-4,8-5,8-9,14-5 

邻接 (adjacency)2-1,2-10 

邻接 矩阵 (adjacency matrix)2-3 

邻 域 平均 (neighborhood averaging)5-8,5-10 ,5-22 

六 边 形 采 样 坐标 系统 (hexagonal sampling coordinate 
system)2-4 

轮廓 (contour)1-10 

罗伯特 交叉 算 子 (Roberts cross operator)9-2 

逻辑 连接 符 (logical connector)15-1 

滤波 器 卷 积 (filter convolution)5-24 


M 


马 步 距离 (knight distance)2-7 

马尔 可 夫 ，。 蒙特 - 卡 洛 (Markov Monte-Carlo)11-17 
模板 (mask)5-25,10-13 

模板 (mask，template)10-13 

模板 卷 积 (mask convolution)5-7 

模板 排序 (mask ordering)5-15 

模板 匹配 (template matching)15-3 

模式 (pattern)17-1 


N 
挠 率 (torsion)12-6 ,12-7 
O 


偶 函 数 (even function)4-1 

欧 氏 变换 (Euclidean transformation)3-8,3-10 
欧 氏 距离 (Euclidean distance)2-8,10-14,16-10 
欧 拉 数 (Euler number)10-7 


Pp 


膨胀 (dilation)16-1,16-4,16-8,16-19 

偏心 率 (eccentricity)10-4 

平滑 操作 (smooth operation)5-12,5-13 

平均 绝对 差 (average absolute difference)8-1,8-2 

平均 码 长 (average code length)7-1 

平均 最 小 距离 (average minimum distance, AMD)15-11 
= 21l = 


平移 变换 (translation transformation)3-4,3-7 
平移 哈 夫 曼 编码 (translation Huffman coding)7-8 
薄 瑞 维特 算 子 (Prewitt operator)9-2 


Q 


齐 次 坐标 (homogeneous coordinates)3-1,3-2 
棋盘 距离 (chessboard distance)16-10 

球状 性 (sphericity)10-4 

区 域 描述 符 (region descriptor)10-9 

曲率 (curvature)11-3,12-6,12-7 


及 


人 类 视觉 系统 (human visual system)18-3 

人 有 眼 焦距 (human eye focal length)1-3 
锐 化 操作 (sharpening operation)5-12,5-13 

弱 透 视 投 影 (weak perspective projection)3-11 


S 


三 基色 (trichromatic)18-3 

色 度 (chromaticity)8-9 

色调 增强 (hue enhancement)8-10 

扇 束 投影 (fan-beam projection)6-12 

摄像 机 运动 (camera motion)14-5,14-7 

摄像 机 运动 (camera movement)1-5 

摄像 机 坐标 系 (camera coordinate system)11-7,11-8 

深度 图 (depth map)14-8 

生成 子 图 (spanning sub-graph)15-9 

剩余 子 图 (residual subgraph)15-9 

失真 测度 (distortion metric)8-1,8-2 

实 函 数 (real function)4-1 

世界 坐标 系 (world coordinate system)3-9,11-7,11-8 

事件 (event)17-10 

视觉 感知 (visual perception)18-11 

视 敏 度 (visual acuity)18-2 

视频 (video)11-12 

视野 (field of vision)18-10 

数字 弧 (digital arc)1-10 

数字 水 印 (digital watermark)8-2,8-3 

双 目 成 像 模 型 (bi-nocular imaging model)13-2 

双 目 成 像 系统 (bi-nocular imaging system)13-5,13-6， 
13-7,13-9,13-10 

双 目 横向 模式 (bi-nocular horizontal model)13-1,13-3 

双 目 会 聚 横向 模式 (bi-nocular focused horizontal 
model)13-3 

双 目 立体 视觉 (bi-nocular stereo vision)14-8 

中 加 和 证 


双 目 纵向 模式 (bi-nocular Longitudinal model)13-3 
水 平 投影 (horizontal projection)6-9 

水 印 不 可 见 性 (watermark invisibility)8-1 

顺序 性 约束 (sequential constraints)13-4 

斯 拉 特 变换 (slant transform)4-6 
算术 编码 (arithmetic coding)7-10,7-11 

缩放 函数 (scaling function)4-16 

索 贝 尔 模板 (Sobel mask)5-6 

索 贝 尔 算 子 (Sobel operator)9-2,9-4,16-17 


亚 


梯度 (gradient)5-10,5-23 

体 素 (voxel)9-1 

跳跃 白色 块 (white block skipping)7-6 

通路 (path)2-2,2-6,2-9,2-10 

同 构 (isomorphic)15-7,15-10 

投影 变换 (projection transformation)3-8,3-9,3-10 
投影 重建 (reconstruction from projection)6-10 
透视 缩短 (perspective shortening)18-9 
透视 缩放 (perspective scaling)18-9 

透视 投影 (perspective projection)3-11 

图 (graph)15-7,15-8,15-9,15-10 

图 像 补 全 (image completion)6-8 

像 采 集 (image acquisition)3-9 

图 像 加 法 (image addition)5-8 

图 像 检 索 (image retrieval)17-8,17-9 
图 像 金字 塔 (image pyramid)8-13 

图 像 模 糊 (image blurring)6-4 

图 像 配 准 (image registration)17-3 ,17-4 
图 像 融 合 (image fusion)17-3 

图 像 修 补 (image repair)6-8 

图 像 修 复 (image inpainting)6-8 

图 像 增 强 (image enhancement)5-1,5-9,5-11 
图 像 子 集 (image sub-set)2-1 


a 


外 接 盒 (Feret box)10-2 

网 格 相交 量化 (grid-intersect quantization)1-11,1-12 
位 面 提取 函数 (bitplane extraction function)5-2 
位 移 不 变性 (translation invariance)16-4 
纹理 基 元 (texture element，texton)14-10,14-11 
纹理 描述 符 (texture descriptor)11-1 

沃 尔 什 变换 (Walsh transform)4-4,4-7 

误差 概率 (probability of error)9-14 


和 


行进 立方 体 (marching cube, MC)12-8 

行为 (behavior)17-10 

细 化 (thinning)16-10,16-11,16-12,16-14 
细节 系数 (detail coefficient)4-17 

先 验 信息 Ca priori information)9-12 

线性 滤波 (linear filtering)5-26 

相对 深度 (relative depth)13-9,14-8 

相对 误差 (relative error)13-9 

相关 品质 (correlation quality)8-2 

相似 变换 (similarity transformation)3-8,3-10,11-5 
像素 距离 误差 (pixel distance error)9-15 

小 波 变 换 (wavelet transform)4-17,4-18 

小 波 反 变换 (inverse wavelet transform)4-17 
小 波 函 数 (wavelet function)4-16 

小 波 特性 (wavelet characteristics)8-15 

斜面 距离 (chamfer distance)2-8 

信 源 炉 (information source entropy)7-2 

信 品 比 (signal-to-noise ratio)7-3,8-2 
形态 学 梯度 (morphological gradient)16-16 ,16-17 
形状 (shape)11-4,11-5 

形状 测度 (shape measure)9-13 

形状 描述 符 (shape descriptor)10-3 ,10-4,10-8 
形状 数 (shape number)10-6 ,15-4 

形状 因子 (form factor)10-4,11-2 

虚假 轮廓 (false contour)5-21 

旋转 变换 (rotation transformation)3-4,3-7 


Y 


亚 采样 (sub-sampling)8-3 

亚 像素 边缘 检测 (sub-pixel edge detection)9-11 

眼 肌 运 动 (eye muscle movement)18-5 

一 阶 编码 (first-order coding)7-2 

一 阶 微分 期 望 值 (expectation of first-order derivative) 
oil 

遗传 算法 (genetic algorithm)9-8 

阴影 (umbra of a surface)16-19 

有 色 图 (colored graph)15-7 

有 约束 最 小 平方 恢复 滤波 器 (constrained least square 


restoration filter)6-5 

语义 网 (semantic network)15-2 

阅 值 编码 (threshold coding)7-14 

阔 值 分 割 (thresholding)9-6,9-12 

形 性 (circularity)10-4 

匀速 直线 运动 模糊 (uniform linear motion blurring) 
6-3 ,6-7 

运动 轨迹 (motion trajectory)11-7 

运动 模式 (motion pattern)11-12 


Zz 





正 累 积 差 图 像 (positive accumulative difference image， 
PADD8-12 

正弦 模式 (sine pattern)6-6,6-7 

知觉 恒 常 性 (perceptual constancy)18-7,18-8 

知识 (knowledge)15-2 

直方 图 均衡 化 (histogram equalization)5-5 

直方 图 相似 性 (histogram similarity)8-2 

中 心 矩 法 (central moment method)17-6 

中 值 (median)5-14 

中 值 滤波 (median filtering)5-15,5-16,5-17 

主动 轮廓 模型 (active contour model)9-12 

主动 视觉 (active vision)1-8 

主 方向 (principal directions)12-2 

专家 系统 (expert system)15-2 

转移 函数 (transfer function)6-3 

锥 细胞 (cone)18-1 

姿态 歧义 (posture ambiguity)3-11 

子 图 (sub-graph)15-8,15-9,15-10 

自然 码 (Natural code)7-1,7-6,7-9 

字符 串 描 述 (string description)10-11 

总 方差 信 品 比 (total variance signal-to-noise ratio)8-2 

组 合 性 (associativity)16-2,16-3 

最 大 似 然 一 最 大 期 望 (maximum likelihood-expectation 
maximization, ML~EM)6-14 

最 大 值 滤 波 (maximum filtering)5-17 

最 频 值 滤 波 (mode filtering)5-17 

最 小 包围 长 方形 (minimum enclosing rectangle)10-2 

最 小 核 同 值 区 (smallest univalue segment assimilating 
nuclear, SUSAN)9-4,9-12 
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